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INTRODUCCION 



Que es Python? 

Python es un lenguaje de programacion creado por Guido van Rossum 
a principios de los anos 90 cuyo nombre esta inspirado en el grupo de 
comicos ingleses “Monty Python”. Es un lenguaje similar a Perl, pero 
con una sintaxis muy limpia y que favorece un codigo legible. 

Se trata de un lenguaje interpretado o de script, con tipado dinamico, 
fuertemente tipado, multiplataforma y orientado a objetos. 

Lenguaje interpretado o de script 

Un lenguaje interpretado o de script es aquel que se ejecuta utilizando 
un programa intermedio llamado interprete, en lugar de compilar el 
codigo a lenguaje maquina que pueda comprender y ejecutar directa- 
mente una computadora (lenguajes compilados). 

La ventaja de los lenguajes compilados es que su ejecucion es mas 
rapida. Sin embargo los lenguajes interpretados son mas flexibles y mas 
portables. 

Python tiene, no obstante, muchas de las caracteristicas de los lengua- 
jes compilados, por lo que se podria decir que es semi interpretado. En 
Python, como en Java y muchos otros lenguajes, el codigo fuente se 
traduce a un pseudo codigo maquina intermedio llamado bytecode la 
primera vez que se ejecuta, generando archivos .pyc o .pyo (bytecode 
optimizado), que son los que se ejecutaran en sucesivas ocasiones. 

Tipado dinamico 

La caracteristica de tipado dinamico se refiere a que no es necesario 
declarar el tipo de dato que va a contener una determinada variable, 



Introduccion 



sino que su tipo se determinara en tiempo de ejecucion segun el tipo 
dei valor al que se asigne, y el tipo de esta variable puede cambiar si se 
le asigna un valor de otro tipo. 

Fuertemente tipado 

No se permite tratar a una variable como si fuera de un tipo distinto 
al que tiene, es necesario convertir de forma explicita dicha variable 
al nuevo tipo previamente. Por ejemplo, si tenemos una variable que 
contiene un texto (variable de tipo cadena o string) no podremos tra- 
tarla como un numero (sumar la cadena "9" y el numero 8). En otros 
lenguajes el tipo de la variable cambiaria para adaptarse al comporta- 
miento esperado, aunque esto es mas propenso a errores. 

Multiplataforma 

El interprete de Python esta disponible en multitud de plataformas 
(UNIX, Solaris, Linux, DOS, Windows, OS/2, Mac OS, etc.) por lo 
que si no utilizamos librerias especificas de cada plataforma nuestro 
programa podra correr en todos estos sistemas sin grandes cambios. 

Orientado a objetos 

La orientacion a objetos es un paradigma de programacion en el que 
los conceptos dei mundo real relevantes para nuestro problema se tras- 
ladan a clases y objetos en nuestro programa. La ejecucion dei progra- 
ma consiste en una serie de interacciones entre los objetos. 

Python tambien permite la programacion imperativa, programacion 
funcional y programacion orientada a aspectos. 

cPor que Python? 

Python es un lenguaje que todo el mundo deberia conocer. Su sintaxis 
simple, clara y sencilla; el tipado dinamico, el gestor de memoria, la 
gran cantidad de librerias disponibles y la potencia dei lenguaje, entre 
otros, hacen que desarrollar una aplicacion en Python sea sencillo, muy 
rapido y, lo que es mas importante, divertido. 

La sintaxis de Python es tan sencilla y cercana al lenguaje natural que 
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los programas elaborados en Python parecen pseudocodigo. Por este 
motivo se trata ademas de uno de los mejores lenguajes para comenzar 
a programar. 

Python no es adecuado sin embargo para la programacion de bajo 
nivei o para aplicaciones en las que el rendimiento sea critico. 

Algunos casos de exito en el uso de Python son Google, Yahoo, la 
NASA, Industrias Ligh & Magic, y todas las distribuciones Linux, en 
las que Python cada vez representa un tanto por ciento mayor de los 
programas disponibles. 

Instalacion de Python 

Existen varias implementaciones distintas de Python: CPython, 
Jython, IronPython, PyPy, etc. 

CPython es la mas utilizada, la mas rapida y la mas madura. Cuando la 
gente habla de Python normalmente se refiere a esta implementacion. 
En este caso tanto el interprete como los modulos estan escritos en C. 

Jython es la implementacion en Java de Python, mientras que 
IronPython es su contrapartida en C# (.NET). Su interes estriva en 
que utilizando estas implementaciones se pueden utilizar todas las 
librerias disponibles para los programadores de Java y .NET. 

PyPy, por ultimo, como habreis adivinado por el nombre, se trata de 
una implementacion en Python de Python. 

CPython esta instalado por defecto en la mayor parte de las distribu- 
ciones Linux y en las ultimas versiones de Mac OS. Para comprobar si 
esta instalado abre una terminal y escribe python. Si esta instalado se 
iniciara la consola interactiva de Python y obtendremos parecido a lo 
siguiente: 

Python 2.5.1 ( r25 1 : 54863 , May 2 2007, 16:56:35) 

[GCC 4.1.2 (Ubuntu 4. 1 . 2-0ubuntu4) ] on linux2 

Type "help", "Copyright", "credits" or "license" for more 

information . 

>>> 
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La primera linea nos indica la version de Python que tenemos ins- 
talada. AI final podemos ver el prompt (»>) que nos indica que el 
interprete esta esperando codigo dei usuario. Podemos salir escribiendo 
exi t ( ), o pulsando Control + D. 

Si no te muestra algo parecido no te preocupes, instalar Python es muy 
sencillo. Puedes descargar la version correspondiente a tu sistema ope- 
rativo desde la web de Python, en http://www.python.org/download/. 
Existen instaladores para Windows y Mac OS. Si utilizas Linux es 
muy probable que puedas instalarlo usando la herramienta de gestion 
de paquetes de tu distribucion, aunque tambien podemos descargar la 
aplicacion compilada desde la web de Python. 

Herramientas basicas 

Existen dos formas de ejecutar codigo Python. Podemos escribir lineas 
de codigo en el interprete y obtener una respuesta dei interprete para 
cada b'nea (sesion interactiva) o bien podemos escribir el codigo de un 
programa en un archivo de texto y ejecutarlo. 

A la hora de realizar una sesion interactiva os aconsejo instalar y uti- 
lizar iPython, en lugar de la consola interactiva de Python. Se puede 
encontrar en http://ipython.scipy.org/. iPython cuenta con caracteristicas 
anadidas muy interesantes, como el autocompletado o el operador ?. 

La funcion de autocompletado se lanza pulsando el tabulador. Si 
escribimos f i y pulsamos Tab nos mostrara una lista de los objetos 
que comienzan con fi (file, f ilter y f inally). Si escribimos f ile. y 
pulsamos Tab nos mostrara una lista de los metodos y propiedades dei 
objeto file. 

El operador ? nos muestra informacion sobre los objetos. Se utiliza 
anadiendo el simbolo de interrogacion al final dei nombre dei objeto 
dei cual queremos mas informacion. Por ejemplo: 

In [3]: str? 

Type: type 
Base Class: 

String Form: 
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Namespace: Python builtin 
Docstring : 

str(object) -> string 

Return a nice string representation of the object. 

If the argument is a string, the return value is the same 
object . 

En el campo de IDEs y editores de codigo gratuitos PyDEV {http:// 
pydev.sourceforge.net/) se alza como cabeza de serie. PyDEV es un plu- 
gin para Eclipse que permite utilizar este IDE multiplataforma para 
programar en Python. Cuenta con autocompletado de codigo (con 
informacion sobre cada elemento), resaltado de sintaxis, un depurador 
grafico, resaltado de errores, explorador de clases, formateo dei codigo, 
refactorizacion, etc. Sin duda es la opcion mas completa, sobre todo si 
instalamos las extensiones comerciales, aunque necesita de una canti- 
dad importante de memoria y no es dei todo estable. 

Otras opciones gratuitas a considerar son SPE o Stanis Python Editor 
(. http.V/sourceforge . net/projects/speZ) , Eric ( http://die-ojfenbachs . de/eric/), 
BOA Constructor ( http://boa-constructor.sourceforge.net/) o incluso 
emacs o vim. 

Si no te importa desembolsar algo de dinero, Komodo {http://www. 
activestate.com/komodo_ide/) y Wing IDE ( http://www.wingware.com/) 
son tambien muy buenas opciones, con montones de caracteristicas 
interesantes, como PyDEV, pero mucho mas estables y robustos. Ade- 
mas, si desarrollas Software libre no comercial puedes contactar con 
Wing Ware y obtener, con un poco de suerte, una licencia gratuita para 
Wing IDE Professional :) 
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MI PRIMER 
PROGRAMA EN 
PYTHON 



Como comentabamos en el capitulo anterior existen dos formas de 
ejecutar codigo Python, bien en una sesion interactiva (linea a linea) 
con el interprete, o bien de la forma habitual, escribiendo el codigo en 
un archivo de codigo fuente y ejecutandolo. 

El primer programa que vamos a escribir en Python es el clasico Hola 
Mundo, y en este lenguaje es tan simple como: 

print "Hola Mundo" 

Vamos a probarlo primero en el interprete. Ejecuta python o ipython 
segun tus preferencias, escribe la linea anterior y pulsa Enter. El inter- 
prete respondera mostrando en la consola el texto Hola Mundo. 

Vamos ahora a crear un archivo de texto con el codigo anterior, de 
forma que pudieramos distribuir nuestro pequeno gran programa entre 
nuestros amigos. Abre tu editor de texto preferido o bien el IDE que 
hayas elegido y copia la linea anterior. Guardalo como hola.py, por 
ejemplo. 

Ejecutar este programa es tan sencillo como indicarle el nombre dei 
archivo a ejecutar al interprete de Python 

python hola.py 
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pero vamos a ver como simplificarlo aun mas. 

Si utilizas Windows los archivos .py ya estaran asociados al interprete 
de Python, por lo que basta hacer doble clic sobre el archivo para eje- 
cutar el programa. Sin embargo como este programa no hace mas que 
imprimir un texto en la consola, la ejecucion es demasiado rapida para 
poder verlo si quiera. Para remediarlo, vamos a anadir una nueva linea 
que espere la entrada de datos por parte dei usuario. 

print "Hola Mundo" 
raw_input( ) 

De esta forma se mostrara una consola con el texto Hola Mundo hasta 
que pulsemos Enter. 

Si utilizas Linux (u otro Unix) para conseguir este comportamiento, es 
decir, para que el sistema operativo abra el archivo .py con el interprete 
adecuado, es necesario anadir una nueva linea al principio dei archivo: 

#! /usr/bin/python 
print "Hola Mundo" 
raw_input( ) 

A esta linea se le conoce en el mundo Unix como shebang , hashbang 
o sharpbang. El par de caracteres # ! indica al sistema operativo que 
dicho script se debe ejecutar utilizando el interprete especificado a 
continuacion. De esto se desprende, evidentemente, que si esta no es la 
ruta en la que esta instalado nuestro interprete de Python, es necesario 
cambiarla. 



Otra opcion es utilizar el programa env (de environment, entorno) 
para preguntar al sistema por la ruta al interprete de Python, de forma 
que nuestros usuarios no tengan ningun problema si se diera el caso de 
que el programa no estuviera instalado en dicha ruta: 



#! /usr/bin/env python 
print "Hola Mundo" 
raw_input( ) 



Por supuesto ademas de anadir el shebang, tendremos que dar permi- 
sos de ejecucion al programa. 
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chmod +x hola.py 

Y listo, si hacemos doble clic el programa se ejecutara, mostrando una 
consola con el texto Hola Mundo, como en el caso de Windows. 

Tambien podriamos correr el programa desde la consola como si trata- 
ra de un ejecutable cualquiera: 

. /hola . py 
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En Python los tipos basicos se dividen en: 

• Numeros, como pueden ser 3 (entero) , 15.57 (de coma flotante) o 
7 + 5j (complejos) 

• Cadenas de texto, como "Hola Mundo" 

• Valores booleanos: True (cierto) y False (falso). 

Vamos a crear un par de variables a modo de ejemplo. Una de tipo 
cadena y una de tipo entero: 

# esto es una cadena 
c = "Hola Mundo" 

# y esto es un entero 
e = 23 

# podemos comprobatio con la funcion type 
type(c) 

type(e) 

Como veis en Python, a diferencia de muchos otros lenguajes, no se 
declara el tipo de la variable al crearla. En Java, por ejemplo, escribiria- 
mos: 

String c = "Hola Mundo"; 
int e = 23; 



Este pequeno ejemplo tambien nos ha servido para presentar los 
comentarios inline en Python: cadenas de texto que comienzan con el 
caracter # y que Python ignora totalmente. Hay mas tipos de comenta- 
rios, de los que hablaremos mas adelante. 
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Numeros 

Como deciamos, en Python se pueden representar numeros enteros, 
reales y complejos. 

Enteros 

Los numeros enteros son aquellos numeros positivos o negativos que 
no tienen decimales (ademas dei cero). En Python se pueden repre- 
sentar mediante el tipo int (de integer, entero) o el tipo long (largo). 
La unica diferencia es que el tipo long permite almacenar numeros 
mas grandes. Es aconsejable no utilizar el tipo long a menos que sea 
necesario, para no malgastar memoria. 

El tipo int de Python se implementa a bajo nivei mediante un tipo 
long de C. Y dado que Python utiliza C por debajo, como C, y a dife- 
rencia de Java, el rango de los valores que puede representar depende 
de la plataforma. 

En la mayor parte de las maquinas el long de C se almacena utilizando 
32 bits, es decir, mediante el uso de una variable de tipo int de Python 
podemos almacenar numeros de -2 31 a 2 31 - 1, o lo que es lo mismo, de 
-2.147.483.648 a 2.147.483.647. En plataformas de 64 bits, el rango es 
de -9.223.372.036.854.775.808 hasta 9.223.372.036.854.775.807. 

El tipo long de Python permite almacenar numeros de cualquier preci- 
sion, estando limitados solo por la memoria disponible en la maquina. 

AI asignar un numero a una variable esta pasara a tener tipo int, a 
menos que el numero sea tan grande como para requerir el uso dei tipo 
long. 

# type(entero) daria int 
entero = 23 

Tambien podemos indicar a Python que un numero se almacene usan- 
do long anadiendo una L al final: 

# type(entero) daria long 
entero = 23L 
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EI literal que se asigna a la variable tambien se puede expresar como 
un octal, anteponiendo un cero: 

# 027 octal = 23 en base 10 
entero = 027 

o bien en hexadecimal, anteponiendo un Ox: 

# 0x17 hexadecimal = 23 en base 10 
entero = 0x17 

Reales 

Los numeros reales son los que tienen decimales. En Python se expre- 
san mediante el tipo f loat. En otros lenguajes de programacion, como 
C, tenemos tambien el tipo double, similar a f loat pero de mayor 
precision (double = doble precision). Python, sin embargo, implementa 
su tipo f loat a bajo nivei mediante una variable de tipo double de C, 
es decir, utilizando 64 bits, luego en Python siempre se utiliza doble 
precision, y en concreto se sigue el estandar IEEE 754: 1 bit para el 
signo, 11 para el exponente, y 52 para la mantisa. Esto significa que los 
valores que podemos representar van desde ±2,2250738585072020 x 
10-308 hasta ±1,7976931348623157x10308. 

La mayor parte de los lenguajes de programacion siguen el mismo 
esquema para la representacion interna. Pero como muchos sabreis 
esta tiene sus limitaciones, impuestas por el hardware. Por eso desde 
Python 2.4 contamos tambien con un nuevo tipo Decimal, para el 
caso de que se necesite representar fracciones de forma mas precisa. 

Sin embargo este tipo esta fuera dei alcance de este tutorial, y solo es 
necesario para el ambito de la programacion cientifica y otros rela- 
cionados. Para aplicaciones normales podeis utilizar el tipo f loat sin 
miedo, como ha venido haciendose desde hace anos, aunque teniendo 
en cuenta que los numeros en coma flotante no son precisos (ni en este 
ni en otros lenguajes de programacion). 

Para representar un numero real en Python se escribe primero la parte 
entera, seguido de un punto y por ultimo la parte decimal. 

real = 0.2703 
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Tambien se puede utilizar notacion cientifica, y anadir una e (de expo- 
nente) para indicar un exponente en base 10. Por ejemplo: 

real = 0. 1 e - 3 

seria equivalente a 0.1 x 10-3 = 0.1 x 0.001 = 0.0001 

Complejos 

Los numeros complejos son aquellos que tienen parte imaginaria. Si 
no conocias de su existencia, es mas que probable que nunca lo vayas a 
necesitar, por lo que puedes saltarte este apartado tranquilamente. De 
hecho la mayor parte de lenguajes de programacion carecen de este 
tipo, aunque sea muy utilizado por ingenieros y cientificos en general. 

En el caso de que necesiteis utilizar numeros complejos, o simplemen- 
te tengais curiosidad, os dire que este tipo, llamado complex en Python, 
tambien se almacena usando coma flotante, debido a que estos nume- 
ros son una extension de los numeros reales. En concreto se almacena 
en una estructura de C, compuesta por dos variables de tipo double, 
sirviendo una de ellas para almacenar la parte real y la otra para la 
parte imaginaria. 

Los numeros complejos en Python se representan de la siguiente 
forma: 

comple jo = 2.1 + 7 . 8 j 

Operadores 

Veamos ahora que podemos hacer con nuestros numeros usando los 
operadores por defecto. Para operaciones mas complejas podemos 
recurrir al modulo math. 

Operadores aritmeticos 



Operador 


Descripcion 


Ejemplo 


+ 


Suma 


r=3+2 #res5 


- 


Resta 


r = 4 - 7 # r es -3 
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Operador 


Descripcion 


Ejemplo 


- 


Negacion 


r = -7 


# r es -7 


* 


Multiplicacion 


r = 2 * 6 


# r es 12 


* * 


Exponente 


r = 2 ** 6 


# r es 64 


/ 


Division 


r = 3.5 / 2 


# r es 1.75 


// 


Division entera 


r = 3.5 // 2 


# r es 1 . 0 


% 


Modulo 


r = 7 % 2 


# r es 1 



Puede que tengais dudas sobre como funciona el operador de modulo, 
y cual es la diferencia entre division y division entera. 

El operador de modulo no hace otra cosa que devolvernos el resto de 
la division entre los dos operandos. En el ejemplo, 7/2 seria 3, con 1 de 
resto, luego el modulo es 1. 

La diferencia entre division y division entera no es otra que la que 
indica su nombre. En la division el resultado que se devuelve es un 
numero real, mientras que en la division entera el resultado que se 
devuelve es solo la parte entera. 

No obstante hay que tener en cuenta que si utilizamos dos operandos 
enteros, Python determinara que queremos que la variable resultado 
tambien sea un entero, por lo que el resultado de, por ejemplo, 3 / 2 y 
3 // 2 seria el mismo: 1. 

Si quisieramos obtener los decimales necesitariamos que al menos uno 
de los operandos fuera un numero real, bien indicando los decimales 

r = 3 . 0 / 2 

o bien utilizando la funcion f loat (no es necesario que sepais lo que 
significa el termino funcion, ni que recordeis esta forma, lo veremos un 
poco mas adelante): 

r = f loat ( 3 ) / 2 

Esto es asi porque cuando se mezclan tipos de numeros, Python con- 
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vierte todos los operandos al tipo mas complejo de entre los tipos de 
los operandos. 

Operadores a nivei de bit 

Si no conoceis estos operadores es poco probable que vayais a necesi- 
tarlos, por lo que podeis obviar esta parte. Si aun asi teneis curiosidad 
os dire que estos son operadores que actuan sobre las representaciones 
en binario de los operandos. 

Por ejemplo, si veis una operacion como 3 & 2, lo que estais viendo es 
un and bit a bit entre los numeros binarios 11 y 10 (las representacio- 
nes en binario de 3 y 2). 

EI operador and (&), dei ingles “y”, devuelve 1 si el primer bit operando 
es 1 y el segundo bit operando es 1. Se devuelve 0 en caso contrario. 

El resultado de aplicar and bit a bit a 11 y 10 seria entonces el numero 
binario 10, o lo que es lo mismo, 2 en decimal (el primer digito es 1 
para ambas cifras, mientras que el segundo es 1 solo para una de ellas). 

El operador or{ I ), dei ingles “o”, devuelve 1 si el primer operando es 1 
o el segundo operando es 1. Para el resto de casos se devuelve 0. 

El operador xor u or exclusivo ( A ) devuelve 1 si uno de los operandos 
es 1 y el otro no lo es. 

El operador not (~), dei ingles “no”, sirve para negar uno a uno cada 
bit; es decir, si el operando es 0, cambia a 1 y si es 1, cambia a 0. 

Por ultimo los operadores de desplazamiento (« y ») sirven para 
desplazar los bits n posiciones hacia la izquierda o la derecha. 



Operador 


Descripcion 


Ejemplo 


& 


and 


r = 3 & 2 # r es 2 


1 


or 


r=3l2 #res3 


A 


xor 


r=3 A 2 #res1 


~ 


not 


r = ~3 # r es -4 
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« 


Desplazamiento izq. 


r = 3 « 1 # r es 6 


» 


Desplazamiento der. 


r = 3 » 1 # r es 1 



Cadenas 

Las cadenas no son mas que texto encerrado entre comillas simples 
( ' cadena ') o dobles ("cadena"). Dentro de las comillas se pueden 
anadir caracteres especiales escapandolos con \, como \n, el caracter de 
nueva linea, o \t, el de tabulacion. 

Una cadena puede estar precedida por el caracter u o el caracter r, los 
cuales indican, respectivamente, que se trata de una cadena que utiliza 
codificacion Unicode y una cadena raw (dei ingles, cruda). Las cade- 
nas raw se distinguen de las normales en que los caracteres escapados 
mediante la barra invertida (\) no se sustituyen por sus contrapartidas. 
Esto es especialmente util, por ejemplo, para las expresiones regulares, 
como veremos en el capitulo correspondiente. 

Unicode = u"aoe" 
raw = r"\n" 



Tambien es posible encerrar una cadena entre triples comillas (simples 
o dobles). De esta forma podremos escribir el texto en varias lineas, y 
al imprimir la cadena, se respetaran los saltos de linea que introdujimos 
sin tener que recurrir al caracter \n, asi como las comillas sin tener que 
escaparlas. 

Las cadenas tambien admiten operadores como +, que funciona reali- 
zando una concatenacion de las cadenas utilizadas como operandos y 
*, en la que se repite la cadena tantas veces como lo indique el numero 
utilizado como segundo operando. 

a = "uno" 
b = "dos" 

c=a+b#ces "unodos" 
c=a*3#ces "unounouno" 



Booleanos 



20 



Tipos basicos 



Como deciamos al comienzo dei capitulo una variable de tipo boolea- 
no solo puede tener dos valores: True (cierto) y False (falso). Estos 
valores son especialmente importantes para las expresiones condicio- 
nales y los bucles, como veremos mas adelante. 

En realidad el tipo bool (el tipo de los booleanos) es una subclase dei 
tipo int. Puede que esto no tenga mucho sentido para ti si no conoces 
los terminos de la orientacion a objetos, que veremos mas adelantes, 
aunque tampoco es nada importante. 

Estos son los distintos tipos de operadores con los que podemos traba- 
jar con valores booleanos, los llamados operadores logicos o condicio- 
nales: 



Operador 


Descripcion 


Ejemplo 


and 


<;se cumple a y b? 


r = True and False # r es 
False 


or 


<;se cumple a o b? 


r = True or False # r es 
True 


not 


No a 


r = not True # r es 

False 



Los valores booleanos son ademas el resultado de expresiones que 
utilizan operadores relacionales (comparaciones entre valores): 



Operador 


Descripcion 


Ejemplo 


== 


<;son iguales a y b? 


r = 5 == 3 # r es 
False 


1 = 


<;son distintos a y b? 


r = 5 != 3 # r es 
True 


< 


<;es a menor que b? 


r=5<3 i r es 
False 


> 


<;es a mayor que b? 


r = 5>3 i ; es 
True 


< = 


<;es a menor o igual que b? 


r = 5 <= 5 # r es 
True 


> = 


<;es a mayor o igual que b? 


r = 5 >= 3 # r es 
True 
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En el capitulo anterior vimos algunos tipos basicos, como los numeros, 
las cadenas de texto y los booleanos. En esta leccion veremos algunos 
tipos de colecciones de datos: listas, tuplas y diccionarios. 

Listas 

La lista es un tipo de coleccion ordenada. Seria equivalente a lo que en 
otros lenguajes se conoce por arrays, o vectores. 

Las listas pueden contener cualquier tipo de dato: numeros, cadenas, 
booleanos, . . . y tambien listas. 

Crear una lista es tan sencillo como indicar entre corchetes, y separa- 
dos por comas, los valores que queremos incluir en la lista: 

1 = [22, True, "una lista", [1, 2]] 

Podemos acceder a cada uno de los elementos de la lista escribiendo el 
nombre de la lista e indicando el indice dei elemento entre corchetes. 
Ten en cuenta sin embargo que el indice dei primer elemento de la 
lista es 0, y no 1: 

1 = [11, False] 

mi_var = 1 [ 0 ] # mi_var vale 11 



Si queremos acceder a un elemento de una lista incluida dentro de otra 
lista tendremos que utilizar dos veces este operador, primero para in- 
dicar a que posicion de la lista exterior queremos acceder, y el segundo 
para seleccionar el elemento de la lista interior: 

1 = [ "una lista" , [ 1 , 2] ] 
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mi_var = 1 [ 1 ] [ 0 ] # mi_var vale 1 

Tambien podemos utilizar este operador para modificar un elemento 
de la lista si lo colocamos en la parte izquierda de una asignacion: 

1 = [22, True] 

# Ahora 1 valdra [99, True] 

1 [0] = 99 

EI uso de los corchetes para acceder y modificar los elementos de una 
lista es comun en muchos lenguajes, pero Python nos depara varias 
sorpresas muy agradables. 

Una curiosidad sobre el operador [ ] de Python es que podemos utili- 
zar tambien numeros negativos. Si se utiliza un numero negativo como 
indice, esto se traduce en que el indice empieza a contar desde el final, 
hacia la izquierda; es decir, con [ - 1 ] accederiamos al ultimo elemento 
de la lista, con [ - 2 ] al penultimo, con [ - 3 ] , al antepenultimo, y asi 
sucesivamente. 

Otra cosa inusual es lo que en Python se conoce como slicing o parti- 
cionado, y que consiste en ampliar este mecanismo para permitir selec- 
cionar porciones de la lista. Si en lugar de un numero escribimos dos 
numeros inicioyfin separados por dos puntos (inicio:fin) Python 
interpretara que queremos una lista que vaya desde la posicion i n i c i o 
a la posicion f in, sin incluir este ultimo. Si escribimos tres numeros 
(inicio:fin:salto)en lugar de dos, el tercero se utiliza para determi- 
nar cada cuantas posiciones anadir un elemento a la lista. 

1 = [99, True, "una lista", [1, 2]] 
mi_var = 1 [ 0 : 2 ] # mi_var vale [99, True] 

mi_var = 1 [ 0 : 4 : 2 ] # mi_var vale [99, "una lista"] 

Los numeros negativos tambien se pueden utilizar en un slicing, con el 
mismo comportamiento que se comento anteriormente. 

Hay que mencionar asi mismo que no es necesario indicar el principio 
y el final dei slicing, sino que, si estos se omiten, se usaran por defecto 
las posiciones de inicio y fin de la lista, respectivamente: 

1 = [99, True, "una lista"] 
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mi_var = 1 [ 1 : ] # mi_var vale [True, "una lista"] 

mi_var = 1 [ : 2 ] # mi_var vale [99, True] 

mi_var = ![:] # mi_var vale [99, True, "una lista"] 

mi_var = 1 [ : : 2 ] # mi_var vale [99, "una lista"] 



Tambien podemos utilizar este mecanismo para modificar la lista: 

1 = [99, True, "una lista", [1, 2]] 

1 [0 : 2 ] = [0, 1] # 1 vale [0, 1, "una lista", [1, 2]] 

pudiendo incluso modificar el tamano de la lista si la lista de la parte 
derecha de la asignacion tiene un tamano menor o mayor que el de la 
seleccion de la parte izquierda de la asignacion: 

1 [ 0 : 2 ] = [False] # 1 vale [False, "una lista", [1, 2]] 

En todo caso las listas ofrecen mecanismos mas comodos para ser mo- 
dificadas a traves de las funciones de la clase correspondiente, aunque 
no veremos estos mecanismos hasta mas adelante, despues de explicar 
lo que son las clases, los objetos y las funciones. 

Tuplas 

Todo lo que hemos explicado sobre las listas se aplica tambien a las 
tuplas, a excepcion de la forma de definirla, para lo que se utilizan 
parentesis en lugar de corchetes. 

t = ( 1 , 2, True, "python") 

En realidad el constructor de la tupla es la coma, no el parentesis, pero 
el interprete muestra los parentesis, y nosotros deberiamos utilizarlos, 
por claridad. 

»> t = 1 , 2 , 3 
»> type(t) 
type "tuple" 

Ademas hay que tener en cuenta que es necesario anadir una coma 
para tuplas de un solo elemento, para diferenciarlo de un elemento 
entre parentesis. 

»> t = (1) 
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»> type(t) 
type "int" 
»> t = ( 1 , ) 
»> type(t) 
type "tuple" 



Para referirnos a elementos de una tupla, como en una lista, se usa el 
operador [ ] : 

mi_var = t [ 0 ] # mi_var es 1 
mi_var = t [ 0 : 2 ] # mi_var es (1, 2) 



Podemos utilizar el operador [ ] debido a que las tuplas, al igual que 
las listas, forman parte de un tipo de objetos llamados secuencias. 
Permitirme un pequeno inciso para indicaros que las cadenas de texto 
tambien son secuencias, por lo que no os extranara que podamos hacer 
cosas como estas: 



c = "hola mundo" 
c[0] # h 

c [ 5 : ] # mundo 

c [ : : 3 ] # hauo 



Volviendo al terna de las tuplas, su diferencia con las listas estriba en 
que las tuplas no poseen estos mecanismos de modificacion a traves 
de funciones tan utiles de los que hablabamos al final de la anterior 
seccion. 



Ademas son inmutables, es decir, sus valores no se pueden modificar 
una vez creada; y tienen un tamano fijo. 

A cambio de estas limitaciones las tuplas son mas “ligeras” que las 
listas, por lo que si el uso que le vamos a dar a una coleccion es muy 
basico, puedes utilizar tuplas en lugar de listas y ahorrar memoria. 



Diccionarios 

Los diccionarios, tambien llamados matrices asociativas, deben su 
nombre a que son colecciones que relacionan una clave y un valor. Por 
ejemplo, veamos un diccionario de peliculas y directores: 

d = { "Love Actually "Richard Curtis", 
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"Kill Bili": "Tarantino", 

"Amelie": "Jean-Pierre Jeunet"} 

EI primer valor se trata de la clave y el segundo dei valor asociado 
a la clave. Como clave podemos utilizar cualquier valor inmutable: 
podriamos usar numeros, cadenas, booleanos, tuplas, . . . pero no listas 
o diccionarios, dado que son mutables. Esto es asi porque los diccio- 
narios se implementan como tablas hash, y a la hora de introducir un 
nuevo par clave-valor en el diccionario se calcula el hash de la clave 
para despues poder encontrar la entrada correspondiente rapidamente. 
Si se modificara el objeto clave despues de haber sido introducido en el 
diccionario, evidentemente, su hash tambien cambiaria y no podria ser 
encontrado. 

La diferencia principal entre los diccionarios y las listas o las tuplas es 
que a los valores almacenados en un diccionario se les accede no por su 
indice, porque de hecho no tienen orden, sino por su clave, utilizando 
de nuevo el operador [ ] . 

d["Love Actually "] # devuelve "Richard Curtis" 

AI igual que en listas y tuplas tambien se puede utilizar este operador 
para reasignar valores. 

d [ "Kill Bili"] = "Quentin Tarantino" 

Sin embargo en este caso no se puede utilizar slicing, entre otras cosas 
porque los diccionarios no son secuencias, si no mappings (mapeados, 
asociaciones). 
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En esta leccion vamos a ver los condicionales y los bucles. 



Sentencias condicionales 

Si un programa no fuera mas que una lista de ordenes a ejecutar de 
forma secuencial, una por una, no tendria mucha utilidad. Los con- 
dicionales nos permiten comprobar condiciones y hacer que nuestro 
programa se comporte de una forma u otra, que ejecute un fragmento 
de codigo u otro, dependiendo de esta condicion. 

Aqui es donde cobran su importancia el tipo booleano y los operadores 
logicos y relacionales que aprendimos en el capitulo sobre los tipos 
basicos de Python. 



La forma mas simple de un estamento condicional es un i f (dei ingles 
si) seguido de la condicion a evaluar, dos puntos ( : ) y en la siguiente 
linea e indentado, el codigo a ejecutar en caso de que se cumpla dicha 
condicion. 

fav = "mundogeek . net" 

# si (if) fav es igual a "mundogeek.net" 
if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 



Como veis es bastante sencillo. 



Eso si, aseguraros de que indentais el codigo tal cual se ha hecho en el 
ejemplo, es decir, aseguraros de pulsar Tabulacion antes de las dos or- 
denes print, dado que esta es la forma de Python de saber que vuestra 
intencion es la de que los dos print se ejecuten solo en el caso de que 
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se cumpla la condicion, y no la de que se imprima la primera cadena si 
se cumple la condicion y la otra siempre, cosa que se expresaria asi: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 



En otros lenguajes de programacion los bloques de codigo se determi- 
nan encerrandolos entre llaves, y el indentarlos no se trata mas que de 
una buena practica para que sea mas sencillo seguir el flujo dei progra- 
ma con un solo golpe de vista. Por ejemplo, el codigo anterior expresa- 
do en Java seria algo asi: 

String fav = "mundogeek.net"; 
if (f av . equals( "mundogeek . net " ) { 

System. out . print 1 n ( "Tienes buen gusto!"); 

System. out . print In ( "Gracias" ) ; 



Sin embargo, como ya hemos comentado, en Python se trata de una 
obligacion, y no de una eleccion. De esta forma se obliga a los progra- 
madores a indentar su codigo para que sea mas sencillo de leer :) 



if ... else 

Vamos a ver ahora un condicional algo mas complicado. ;Que haria- 
mos si quisieramos que se ejecutaran unas ciertas ordenes en el caso de 
que la condicion no se cumpliera? Sin duda podriamos anadir otro if 
que tuviera como condicion la negacion dei primero: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 

if fav != "mundogeek.net": 
print "Vaya, que lastima" 



pero el condicional tiene una segunda construccion mucho mas util: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 
else : 

print "Vaya, que lastima" 
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Vemos que la segunda condicion se puede sustituir con un else (dei 
ingles: si no, en caso contrario). Si leemos el codigo vemos que tiene 
bastante sentido: “si fav es igual a mundogeek.net, imprime esto y esto, 
si no, imprime esto otro”. 

if ... elif ... elif ... else 

Todavia queda una construccion mas que ver, que es la que hace uso 
dei elif. 

if numero < 0: 

print "Negativo" 
elif numero > 0: 

print "Positivo" 
else : 

print "Cero" 

e 1 i f es una contraccion de else if, por lo tanto e 1 i f numero > ©puede 
leerse como “si no, si numero es mayor que 0”. Es decir, primero se 
evalua la condicion dei if. Si es cierta, se ejecuta su codigo y se con- 
tinua ejecutando el codigo posterior al condicional; si no se cumple, 
se evalua la condicion dei elif. Si se cumple la condicion dei elif 
se ejecuta su codigo y se continua ejecutando el codigo posterior al 
condicional; si no se cumple y hay mas de un el i f se continua con el 
siguiente en orden de aparicion. Si no se cumple la condicion dei i f ni 
de ninguno de los elif, se ejecuta el codigo dei else. 

A if C else B 

Tambien existe una construccion similar al operador ? de otros lengua- 
jes, que no es mas que una forma compacta de expresar un if else. En 
esta construccion se evalua el predicado C y se devuelve A si se cumple 
o B si no se cumple: A if C else B. Veamos un ejemplo: 

var = "par" if (num % 2 == 0) else "impar" 

Y eso es todo. Si conoceis otros lenguajes de programacion puede que 
esperarais que os hablara ahora dei switch, pero en Python no existe 
esta construccion, que podria emularse con un simple diccionario, asi 
que pasemos directamente a los bucles. 
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Bucles 

Mientras que los condicionales nos permiten ejecutar distintos frag- 
mentos de codigo dependiendo de ciertas condiciones, los bucles nos 
permiten ejecutar un mismo fragmento de codigo un cierto numero de 
veces, mientras se cumpla una determinada condicion. 

while 

El bucle while (mientras) ejecuta un fragmento de codigo mientras se 
cumpla una condicion. 



edad = 0 
while edad < 18: 
edad = edad + 1 

print "Felicidades , tienes " + str(edad) 

La variable edad comienza valiendo 0. Como la condicion de que edad 
es menor que 18 es cierta (0 es menor que 18), se entra en el bucle. 

Se aumenta edad en 1 y se imprime el mensaje informando de que 
el usuario ha cumplido un ano. Recordad que el operador + para las 
cadenas funciona concatenando ambas cadenas. Es necesario utilizar 
la funcion s t r (de string, cadena) para crear una cadena a partir dei 
numero, dado que no podemos concatenar numeros y cadenas, pero ya 
comentaremos esto y mucho mas en proximos capitulos. 

Ahora se vuelve a evaluar la condicion, y 1 sigue siendo menor que 18, 
por lo que se vuelve a ejecutar el codigo que aumenta la edad en un 
ano e imprime la edad en la pantalla. El bucle continuara ejecutandose 
hasta que edad sea igual a 18, momento en el cual la condicion dejara 
de cumplirse y el programa continuaria ejecutando las instrucciones 
siguientes al bucle. 

Ahora imaginemos que se nos olvidara escribir la instruccion que 
aumenta la edad. En ese caso nunca se llegaria a la condicion de que 
edad fiiese igual o mayor que 18, siempre seria 0, y el bucle continuaria 
indefinidamente escribiendo en pantalla Has cumplido 0. 

Esto es lo que se conoce como un bucle infinito. 
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Sin embargo hay situaciones en las que un bucle infinito es util. Por 
ejemplo, veamos un pequeno programa que repite todo lo que el usua- 
rio diga hasta que escriba adios. 

while True: 

entrada = raw_input("> ") 
if entrada == "adios" : 
break 
else : 

print entrada 

Para obtener lo que el usuario escriba en pantalla utilizamos la funcion 
raw_input. No es necesario que sepais que es una funcion ni como 
funciona exactamente, simplemente aceptad por ahora que en cada 
iteracion dei bucle la variable entrada contendra lo que el usuario 
escribio hasta pulsar Enter. 

Comprobamos entonces si lo que escribio el usuario fue adios, en cuyo 
caso se ejecuta la orden break o si era cualquier otra cosa, en cuyo caso 
se imprime en pantalla lo que el usuario escribio. 

La palabra clave break (romper) sale dei bucle en el que estamos. 

Este bucle se podria haber escrito tambien, no obstante, de la siguiente 
forma: 

salir = False 
while not salir: 

entrada = raw_input() 
if entrada == "adios" : 
salir = True 
else : 

print entrada 

pero nos ha servido para ver como funciona break. 

Otra palabra clave que nos podemos encontrar dentro de los bucles es 
continue (continuar). Como habreis adivinado no hace otra cosa que 
pasar directamente a la siguiente iteracion dei bucle. 



edad = 0 
while edad < 18: 
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edad = edad + 1 
if edad % 2 == 0: 
continue 

print "Felicidades , tienes " + str(edad) 

Como veis esta es una pequena modificacion de nuestro programa de 
felicitaciones. En esta ocasion hemos anadido un if que comprueba si 
la edad es par, en cuyo caso saltamos a la proxima iteracion en lugar de 
imprimir el mensaje. Es decir, con esta modificacion el programa solo 
imprimiria felicitaciones cuando la edad fuera impar. 

for ... in 

A los que hayais tenido experiencia previa con segun que lenguajes este 
bucle os va a sorprender gratamente. En Python for se utiliza como 
una forma generica de iterar sobre una secuencia. Y como tal intenta 
facilitar su uso para este fin. 

Este es el aspecto de un bucle for en Python: 

secuencia = ["uno", "dos", "tres"] 
for elemento in secuencia: 
print elemento 

Como hemos dicho los for se utilizan en Python para recorrer secuen- 
cias, por lo que vamos a utilizar un tipo secuencia, como es la lista, para 
nuestro ejemplo. 

Leamos la cabecera dei bucle como si de lenguaje natural se tratara: 
“para cada elemento en secuencia”. Y esto es exactamente lo que hace 
el bucle: para cada elemento que tengamos en la secuencia, ejecuta 
estas lineas de codigo. 

Lo que hace la cabecera dei bucle es obtener el siguiente elemento de 
la secuencia secuencia y almacenarlo en una variable de nombre ele- 
mento. Por esta razon en la primera iteracion dei bucle elemento valdra 
"uno", en la segunda "dos", y en la tercera "tres". 

Facil y sencillo. 

En C o C++, por ejemplo, lo que habriamos hecho seria iterar sobre las 
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posiciones, y no sobre los elementos: 

int mi_array[] = {1, 2, 3, 4, 5}; 
int i ; 

for(i =0; i < 5; i++) { 

printf ("%d\n" , mi_array[ i ] ) ; 

} 



Es decir, tendriamos un bucle for que fuera aumentando una variable 
i en cada iteracion, desde 0 al tamano de la secuencia, y utilizariamos 
esta variable a modo de indice para obtener cada elemento e imprimir- 
lo. 

Como veis el enfoque de Python es mas natural e intuitivo. 

Pero, ;que ocurre si quisieramos utilizar el for como si estuvieramos en 
C o en Java, por ejemplo, para imprimir los numeros de 30 a 50? No os 
preocupeis, porque no necesitariais crear una lista y anadir uno a uno 
los numeros dei 30 al 50. Python proporciona una funcion llamada 
range (rango) que permite generar una lista que vaya desde el primer 
numero que le indiquemos al segundo. Lo veremos despues de ver al 
fin a que se refiere ese termino tan recurrente: las funciones. 
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Una funcion es un fragmento de codigo con un nombre asociado que 
realiza una serie de tareas y devuelve un valor. A los fragmentos de 
codigo que tienen un nombre asociado y no devuelven valores se les 
suele llamar procedimientos. En Python no existen los procedimien- 
tos, ya que cuando el programador no especifica un valor de retorno la 
funcion devuelve el valor None (nada), equivalente al null de Java. 

Ademas de ayudarnos a programar y depurar dividiendo el programa 
en partes las funciones tambien permiten reutilizar codigo. 

En Python las funciones se declaran de la siguiente forma: 

def mi_f uncionfparaml , param2): 
print paraml 
print param2 

Es decir, la palabra clave def seguida dei nombre de la funcion y entre 
parentesis los argumentos separados por comas. A continuacion, en 
otra linea, indentado y despues de los dos puntos tendriamos las lineas 
de codigo que conforman el codigo a ejecutar por la funcion. 

Tambien podemos encontrarnos con una cadena de texto como 
primera linea dei cuerpo de la funcion. Estas cadenas se conocen con 
el nombre de docstring (cadena de documentacion) y sirven, como su 
nombre indica, a modo de documentacion de la funcion. 

def mi_funcion(param1 , param2): 

"""Esta funcion imprime los dos valores pasados 
como parametros""" 
print paraml 
print param2 

Esto es lo que imprime el opeardor ? de iPython o la funcion help 



34 



Funciones 



dei lenguaje para proporcionar una ayuda sobre el uso y utilidad de 
las funciones. Todos los objetos pueden tener docstrings, no solo las 
funciones, como veremos mas adelante. 

Volviendo a la declaracion de funciones, es importante aclarar que 
al declarar la funcion lo unico que hacemos es asociar un nombre al 
fragmento de codigo que conforma la funcion, de forma que podamos 
ejecutar dicho codigo mas tarde referenciandolo por su nombre. Es 
decir, a la hora de escribir estas lineas no se ejecuta la funcion. Para 
llamar a la funcion (ejecutar su codigo) se escribiria: 

mi_f uncionf "hola" , 2) 

Es decir, el nombre de la funcion a la que queremos llamar seguido de 
los valores que queramos pasar como parametros entre parentesis. La 
asociacion de los parametros y los valores pasados a la funcion se hace 
normalmente de izquierda a derecha: como a paraml le hemos dado un 
valor "hola" y param2 vale 2, mi_funcion imprimiria hola en una linea, 
y a continuacion 2. 

Sin embargo tambien es posible modificar el orden de los parametros 
si indicamos el nombre dei parametro al que asociar el valor a la hora 
de llamar a la funcion: 

mi_f uncion(param2 = 2, paraml = "hola") 

El numero de valores que se pasan como parametro al llamar a la fun- 
cion tiene que coincidir con el numero de parametros que la funcion 
acepta segun la declaracion de la funcion. En caso contrario Python se 
quejara: 

»> mi_f uncionf "hola" ) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: mi_funcion() takes exactly 2 arguments (1 given) 

Tambien es posible, no obstante, definir funciones con un numero va- 
riable de argumentos, o bien asignar valores por defecto a los parame- 
tros para el caso de que no se indique ningun valor para ese parametro 
al llamar a la funcion. 
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Los valores por defecto para los parametros se definen situando un 
signo igual despues dei nombre dei parametro y a continuacion el valor 
por defecto: 

def imprimir( texto , veces = 1): 
print veces * texto 



En el ejemplo anterior si no indicamos un valor para el segundo 
parametro se imprimira una sola vez la cadena que le pasamos como 
primer parametro: 

»> imprimir( "hola" ) 
hola 



si se le indica otro valor, sera este el que se utilice: 

»> imprimir( "hola" , 2) 
holahola 



Para definir funciones con un numero variable de argumentos coloca- 
mos un ultimo parametro para la funcion cuyo nombre debe preceder- 
se de un signo *: 

def varios(paraml , param2, *otros): 
for val in otros: 
print otros 

varios(l, 2) 
varios(1, 2, 3) 
varios(l, 2, 3, 4) 



Esta sintaxis funciona creando una tupla (de nombre otros en el 
ejemplo) en la que se almacenan los valores de todos los parametros 
extra pasados como argumento. Para la primera llamada, varios( 1 , 2), 
la tupla otros estaria vacia dado que no se han pasado mas parametros 
que los dos definidos por defecto, por lo tanto no se imprimiria nada. 
En la segunda llamada otros valdria ( 3 , ) , y en la tercera ( 3 , 4 ) . 



Tambien se puede preceder el nombre dei ultimo parametro con **, en 
cuyo caso en lugar de una tupla se utilizaria un diccionario. Las claves 
de este diccionario serian los nombres de los parametros indicados al 
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llamar a la funcion y los valores dei diccionario, los valores asociados a 
estos parametros. 

En el siguiente ejemplo se utiliza la funcion items de los diccionarios, 
que devuelve una lista con sus elementos, para imprimir los parametros 
que contiene el diccionario. 

def varios(param1 , param2, **otros): 
for i in otros . items( ) : 
print i 

varios( 1 , 2, tercero = 3) 

Los que conozcais algun otro lenguaje de programacion os estareis 
preguntando si en Python al pasar una variable como argumento de 
una funcion estas se pasan por referencia o por valor. En el paso por 
referenda lo que se pasa como argumento es una referencia o puntero 
a la variable, es decir, la direccion de memoria en la que se encuentra el 
contenido de la variable, y no el contenido en si. En el paso por valor, 
por el contrario, lo que se pasa como argumento es el valor que conte- 
nta la variable. 

La diferencia entre ambos estriba en que en el paso por valor los 
cambios que se hagan sobre el parametro no se ven fuera de la fun- 
cion, dado que los argumentos de la funcion son variables locales a la 
funcion que contienen los valores indicados por las variables que se 
pasaron como argumento. Es decir, en realidad lo que se le pasa a la 
funcion son copias de los valores y no las variables en si. 

Si quisieramos modificar el valor de uno de los argumentos y que estos 
cambios se reflejaran fuera de la funcion tendriamos que pasar el para- 
metro por referencia. 

En C los argumentos de las funciones se pasan por valor, aunque se 
puede simular el paso por referencia usando punteros. En Java tambien 
se usa paso por valor, aunque para las variables que son objetos lo que 
se hace es pasar por valor la referencia al objeto, por lo que en realidad 
parece paso por referencia. 

En Python tambien se utiliza el paso por valor de referendas a objetos, 
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como en Java, aunque en el caso de Python, a diferencia de Java, todo 
es un objeto (para ser exactos lo que ocurre en realidad es que al objeto 
se le asigna otra etiqueta o nombre en el espacio de nombres local de la 
funcion). 

Sin embargo no todos los cambios que hagamos a los parametros 
dentro de una funcion Python se reflejaran fuera de esta, ya que hay 
que tener en cuenta que en Python existen objetos inmutables, como 
las tuplas, por lo que si intentaramos modificar una tupla pasada como 
parametro lo que ocurriria en realidad es que se crearia una nueva ins- 
tantia, por lo que los cambios no se verian fuera de la funcion. 

Veamos un pequeno programa para demostrarlo: 

def f ( x , y): 
x = x + 3 
y . append(23) 
print x, y 

x = 22 

y = [22] 

f (X, y) 
print x, y 

El resultado de la ejecucion de este programa seria 

25 [22, 23] 

22 [22, 23] 

Como vernos la variable x no conserva los cambios una vez salimos de 
la funcion porque los enteros son inmutables en Python. Sin embargo 
la variable y si los conserva, porque las listas son mutables. 

En resumen: los valores mutables se comportan como paso por refe- 
rentia, y los inmutables como paso por valor. 

Con esto terminamos todo lo relacionado con los parametros de las 
funciones. Veamos por ultimo como devolver valores, para lo que se 
utiliza la palabra clave return: 

def sumar(x, y) : 
return x + y 
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print sumar(3, 2) 

Como vemos esta funcion tan sencilla no hace otra cosa que sumar los 
valores pasados como parametro y devolver el resultado como valor de 
retorno. 

Tambien podriamos pasar varios valores que retornar a return. 

def f ( x , y): 

return x * 2, y * 2 

a, b = f ( 1 , 2) 

Sin embargo esto no quiere decir que las funciones Python puedan de- 
volver varios valores, lo que ocurre en realidad es que Python crea una 
tupla al vuelo cuyos elementos son los valores a retornar, y esta unica 
variable es la que se devuelve. 
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En el capitulo de introduccion ya comentabamos que Python es un 
lenguaje multiparadigma en el se podia trabajar con programacion es- 
tructurada, como veniamos haciendo hasta ahora, o con programacion 
orientada a objetos o programacion funcional. 

La Programacion Orientada a Objetos (POO u OOP segun sus siglas 
en ingles) es un paradigma de programacion en el que los conceptos 
dei mundo real relevantes para nuestro problema se modelan a traves 
de clases y objetos, y en el que nuestro programa consiste en una serie 
de interacciones entre estos objetos. 

Clases y objetos 

Para entender este paradigma primero tenemos que comprender que es 
una clase y que es un objeto. Un objeto es una entidad que agrupa un 
estado y una funcionalidad relacionadas. El estado dei objeto se define 
a traves de variables llamadas atributos, mientras que la funcionalidad 
se modela a traves de funciones a las que se les conoce con el nombre 
de metodos dei objeto. 

Un ejemplo de objeto podria ser un coche, en el que tendriamos atri- 
butos como la marca, el numero de puertas o el tipo de carburante y 
metodos como arrancar y parar. O bien cualquier otra combinacion de 
atributos y metodos segun lo que fuera relevante para nuestro progra- 
ma. 



Una clase, por otro lado, no es mas que una plantilla generica a partir 
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de la cual instanciar los objetos; plantilla que es la que define que atri- 
butos y metodos tendran los objetos de esa clase. 

Volviendo a nuestro ejemplo: en el mundo real existe un conjunto de 
objetos a los que llamamos coches y que tienen un conjunto de atribu- 
tos comunes y un comportamiento comun, esto es a lo que llamamos 
clase. Sin embargo, mi coche no es igual que el coche de mi vecino, y 
aunque pertenecen a la misma clase de objetos, son objetos distintos. 



En Python las clases se definen mediante la palabra clave class segui- 
da dei nombre de la clase, dos puntos ( : ) y a continuacion, indentado, 
el cuerpo de la clase. Como en el caso de las funciones, si la primera 
linea dei cuerpo se trata de una cadena de texto, esta sera la cadena de 
documentacion de la clase o docstring. 

class Coche: 

" " "Abstraccion de los objetos coche.""" 

def init (self, gasolina): 

self .gasolina = gasolina 

print "Tenemos", gasolina, "litros" 

def arrancar(self ) : 

if self .gasolina > 0: 
print "Arranca" 
else : 

print "No arranca" 

def conducir(self ) : 

if self .gasolina > 0: 
self .gasolina -= 1 

print "Quedan", self .gasolina, "litros" 
else : 

print "No se mueve" 



Lo primero que llama la atencion en el ejemplo anterior es el nombre 

tan curioso que tiene el metodo init . Este nombre es una conven- 

cion y no un capricho. El metodo init , con una doble barra baja al 

principio y final dei nombre, se ejecuta justo despues de crear un nuevo 
objeto a partir de la clase, proceso que se conoce con el nombre de 

instanciacion. El metodo init sirve, como sugiere su nombre, para 

realizar cualquier proceso de inicializacion que sea necesario. 

Como vernos el primer parametro de init y dei resto de metodos 
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de la clase es siempre self. Esta es una idea inspirada en Modula-3 y 
sirve para referirse al objeto actual. Este mecanismo es necesario para 
poder acceder a los atributos y metodos dei objeto diferenciando, por 
ejemplo, una variable local mi_var de un atributo dei objeto self . 
mi_var. 

Si volvemos al metodo init de nuestra clase Coche veremos como 

se utiliza self para asignar al atributo gasolina dei objeto (self .gaso- 
1 ina) el valor que el programador especifico para el parametro gasol i - 
na. El parametro gasolina se destruye al final de la funcion, mientras 
que el atributo gasolina se conserva (y puede ser accedido) mientras el 
objeto viva. 

Para crear un objeto se escribiria el nombre de la clase seguido de cual- 
quier parametro que sea necesario entre parentesis. Estos parametros 

son los que se pasaran al metodo init , que como deciamos es el 

metodo que se llama al instanciar la clase. 

mi_coche = Coche(3) 

Os preguntareis entonces como es posible que a la hora de crear nues- 

tro primer objeto pasemos un solo parametro a init , el numero 

3, cuando la definicion de la funcion indica claramente que precisa de 
dos parametros (self y gasolina). Esto es asi porque Python pasa el 
primer argumento (la referenda al objeto que se crea) automagicamen- 
te. 

Ahora que ya hemos creado nuestro objeto, podemos acceder a sus 
atributos y metodos mediante la sintaxis objeto. atri butoy objeto. 
metodo( ): 

»> print mi_coche. gasolina 
3 

»> mi_coche . arrancar( ) 

Arranca 

»> mi_coche . conducir( ) 

Quedan 2 litros 
»> mi_coche . conducir( ) 

Quedan 1 litros 
»> mi_coche . conducir( ) 

Quedan 0 litros 
»> mi_coche . conducir( ) 
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No se mueve 

»> mi_coche . arrancar( ) 

No arranca 

»> print mi_coche.gasolina 
0 



Como ultimo apunte recordar que en Python, como ya se comento 
en repetidas ocasiones anteriormente, todo son objetos. Las cadenas, 
por ejemplo, tienen metodos como upper ( ), que devuelve el texto en 
mayusculas o count(sub), que devuelve el numero de veces que se 
encontro la cadena sub en el texto. 



Herencia 

Hay tres conceptos que son basicos para cualquier lenguaje de pro- 
gramacion orientado a objetos: el encapsulamiento, la herencia y el 
polimorfismo. 

En un lenguaje orientado a objetos cuando hacemos que una clase 
(subclase) herede de otra clase (superclase) estamos haciendo que la 
subclase contenga todos los atributos y metodos que tenia la supercla- 
se. No obstante al acto de heredar de una clase tambien se le llama a 
menudo “extender una clase”. 

Supongamos que queremos modelar los instrumentos musicales de 
una banda, tendremos entonces una clase Guitarra, una clase Bateri a, 
una clase Ba jo, etc. Cada una de estas clases tendra una serie de atribu- 
tos y metodos, pero ocurre que, por el mero hecho de ser instrumentos 
musicales, estas clases compartiran muchos de sus atributos y metodos; 
un ejemplo seria el metodo tocar( ). 

Es mas sencillo crear un tipo de objeto Instrumento con las atributos y 
metodos comunes e indicar al programa que Guitarra, Bateria y Ba jo 
son tipos de instrumentos, haciendo que hereden de Instrumento. 

Para indicar que una clase hereda de otra se coloca el nombre de la cla- 
se de la que se hereda entre parentesis despues dei nombre de la clase: 



class Instrumento: 

def init (self, precio): 
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self . precio = precio 

def tocar(self): 

print "Estamos tocando musica" 

def romper(self ) : 

print "Eso lo pagas tu" 
print "Son", self. precio, "$$$" 

class Bateria( Instrumento) : 
pass 

class Guitarra( Instrumento) : 
pass 

Como Bateria y Guitarra heredan de Instrumento, ambos tienen un 
metodo tocar( ) y un metodo romper( ),y se inicializan pasando un 
parametro precio. Pero, <jque ocurriria si quisieramos especificar un 
nuevo parametro tipo_cuerda a la hora de crear un objeto Guitarra? 

Bastaria con escribir un nuevo metodo init para la clase Guitarra 

que se ejecutaria en lugar dei init de Instrumento. Esto es lo que 

se conoce como sobreescribir metodos. 

Ahora bien, puede ocurrir en algunos casos que necesitemos sobrees- 
cribir un metodo de la clase padre, pero que en ese metodo queramos 
ejecutar el metodo de la clase padre porque nuestro nuevo metodo no 
necesite mas que ejecutar un par de nuevas instrucciones extra. En ese 
caso usariamos la sintaxis SuperCIase .metodo( self , args) para llamar 
al metodo de igual nombre de la clase padre. Por ejemplo, para llamar 

al metodo init de Instrumento desde Guitarra usariamos Instru- 
mento. init (self, precio) 

Observad que en este caso si es necesario especificar el parametro self. 

Herencia multiple 

En Python, a diferencia de otros lenguajes como Java o C#, se permite 
la herencia multiple, es decir, una clase puede heredar de varias clases a 
la vez. Por ejemplo, podriamos tener una clase Cocodrilo que heredara 
de la clase Terrestre, con metodos como caminar( ) y atributos como 
veIocidad_caminar y de la clase Acuatico, con metodos como nadar( ) 
y atributos como ve!ocidad_nadar. Basta con enumerar las clases de 
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las que se hereda separandolas por comas: 

class Cocodrilo(Terrestre, Acuatico): 
pass 

En el caso de que alguna de las clases padre tuvieran metodos con el 
mismo nombre y numero de parametros las clases sobreescribirian la 
implementacion de los metodos de las clases mas a su derecha en la 
definicion. 

En el siguiente ejemplo, como Terrestre se encuentra mas a la iz- 
quierda, seria la definicion de desplazar de esta clase la que prevale- 
ceria, y por lo tanto si llamamos al metodo desplazar de un objeto de 
tipo Cocodrilo lo que se imprimiria seria “El animal anda”. 

class Terrestre: 

def desplazar(self ) : 

print "El animal anda" 

class Acuatico: 

def desplazar(self ) : 

print "El animal nada" 

class Cocodrilo(Terrestre, Acuatico): 
pass 

c = Cocodrilo( ) 
c . desplazar ( ) 

Polimorfismo 

La palabra polimorfismo, dei latin polys morphos (varias formas), se re- 
fiere a la habili dad de objetos de distintas clases de responder al mismo 
mensaje. Esto se puede conseguir a traves de la herencia: un objeto de 
una clase derivada es al mismo tiempo un objeto de la clase padre, de 
forma que alii donde se requiere un objeto de la clase padre tambien se 
puede utilizar uno de la clase hija. 

Python, al ser de tipado dinamico, no impone restricciones a los tipos 
que se le pueden pasar a una funcion, por ejemplo, mas alia de que el 
objeto se comporte como se espera: si se va a llamar a un metodo f ( ) 
dei objeto pasado como parametro, por ejemplo, evidentemente el 
objeto tendra que contar con ese metodo. Por ese motivo, a diferencia 
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de lenguajes de tipado estatico como Java o C++, el polimorfismo en 
Python no es de gran importanda. 

En ocasiones tambien se utiliza el termino polimorfismo para referirse 
a la sobrecarga de metodos, termino que se define como la capacidad 
dei lenguaje de determinar que metodo ejecutar de entre varios meto- 
dos con igual nombre segun el tipo o numero de los parametros que se 
le pasa. En Python no existe sobrecarga de metodos (el ultimo metodo 
sobreescribiria la implementacion de los anteriores), aunque se puede 
conseguir un comportamiento similar recurriendo a funciones con va- 
lores por defecto para los parametros o a la sintaxis *params o **params 
explicada en el capitulo sobre las funciones en Python, o bien usando 
decoradores (mecanismo que veremos mas adelante). 

Encapsulacion 

La encapsulacion se refiere a impedir el acceso a determinados me- 
todos y atributos de los objetos estableciendo asi que puede utilizarse 
desde fuera de la clase. 

Esto se consigue en otros lenguajes de programacion como Java utili- 
zando modificadores de acceso que definen si cualquiera puede acceder 
a esa funcion o variable (public) o si esta restringido el acceso a la 
propia clase (private). 

En Python no existen los modificadores de acceso, y lo que se suele 
hacer es que el acceso a una variable o funcion viene determinado por 
su nombre: si el nombre comienza con dos guiones bajos (y no termina 
tambien con dos guiones bajos) se trata de una variable o funcion pri- 
vada, en caso contrario es publica. Los metodos cuyo nombre comien- 
za y termina con dos guiones bajos son metodos especiales que Python 
llama automaticamente bajo ciertas circunstancias, como veremos al 
final dei capitulo. 

En el siguiente ejemplo solo se imprimira la cadena correspondiente al 

metodo pubi i co ( ) , mientras que al intentar Uamar al metodo pri - 

vado( ) Python lanzara una excepcion quejandose de que no existe 
(evidentemente existe, pero no lo podemos ver porque es privado). 
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class Ejemplo: 

def publicofself ) : 
print "Publico" 

def privado(self ) : 

print "Privado" 

ej = Ejemplo() 
ej .publico( ) 
ej . privado( ) 



Este mecanismo se basa en que los nombres que comienzan con un 
doble guion bajo se renombran para incluir el nombre de la clase. Esto 
implica que el metodo o atributo no es realmente privado, y podemos 
acceder a el mediante una pequena trampa: 

ej ._Ejemplo privado( ) 



En ocasiones tambien puede suceder que queramos permitir el acceso 
a algun atributo de nuestro objeto, pero que este se produzca de forma 
controlada. Para esto podemos escribir metodos cuyo unico cometido 
sea este, metodos que normalmente, por convencion, tienen nombres 
como getVariable y setVariable; de ahi que se conozcan tambien con 
el nombre de getters y setters. 

class Fecha(): 

def init (self ) : 

self. dia = 1 

def ge tDi a ( se 1 f ) : 

return self. dia 

def setDia(self, dia): 

if dia > 0 and dia < 31 : 

self. dia = dia 

else : 

print "Error" 

mi_fecha = Fecha() 
mi_fecha . setDia(33) 



Esto se podria simplificar mediante propiedades, que abstraen al usua- 
rio dei hecho de que se esta utilizando metodos entre bambalinas para 
obtener y modificar los valores dei atributo: 
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class Fecha(object) : 

def init (self ) : 

self. dia = 1 

def ge tDi a (self) : 

return self. dia 

def setDia(self, dia): 

if dia > 0 and dia < 31 : 

self . dia = dia 

else : 

print "Error" 

dia = property(getDia , setDia) 

mi_fecha = Fecha() 
mi_fecha.dia = 33 



Clases de “nuevo-estilo” 

En el ejemplo anterior os habra llamado la atencion el hecho de que la 
clase Fecha derive de ob ject. La razon de esto es que para poder usar 
propiedades la clase tiene que ser de “nuevo-estilo”, clases enriquecidas 
introducidas en Python 2.2 que seran el estandar en Python 3.0 pero 
que aun conviven con las clases “clasicas” por razones de retrocompa- 
tibilidad. Ademas de las propiedades las clases de nuevo estilo anaden 
otras funcionalidades como descriptores o metodos estaticos. 



Para que una clase sea de nuevo estilo es necesario, por ahora, que 
extienda una clase de nuevo-estilo. En el caso de que no sea necesa- 
rio heredar el comportamiento o el estado de ninguna clase, como en 
nuestro ejemplo anterior, se puede heredar de ob ject, que es un objeto 
vacio que sirve como base para todas las clases de nuevo estilo. 



La diferencia principal entre las clases antiguas y las de nuevo estilo 
consiste en que a la hora de crear una nueva clase anteriormente no se 
definia realmente un nuevo tipo, sino que todos los objetos creados a 
partir de clases, fueran estas las clases que fueran, eran de tipo instan- 
ce. 

Metodos especiales 

Ya vimos al principio dei articulo el uso dei metodo init . Exis- 
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ten otros metodos con significados especiales, cuyos nombres siempre 
comienzan y terminan con dos guiones bajos. A continuacion se listan 
algunos especialmente utiles. 

init (self, args) 

Metodo llamado despues de crear el objeto para realizar tareas de 
inicializacion. 

new (cis, args) 

Metodo exclusivo de las clases de nuevo estilo que se ejecuta antes que 

init y que se encarga de construir y devolver el objeto en si. Es 

equivalente a los constructores de C++ o Java. Se trata de un metodo 
estatico, es decir, que existe con independencia de las instancias de 
la clase: es un metodo de clase, no de objeto, y por lo tanto el primer 
parametro no es self, sino la propia clase: cis. 

dei (self) 

Metodo llamado cuando el objeto va a ser borrado. Tambien llamado 
destructor, se utiliza para realizar tareas de limpieza. 

str (self) 

Metodo llamado para crear una cadena de texto que represente a nues- 
tro objeto. Se utiliza cuando usamos print para mostrar nuestro objeto 
o cuando usamos la funcion str (ob j ) para crear una cadena a partir de 
nuestro objeto. 

cmp (self, otro) 

Metodo llamado cuando se utilizan los operadores de comparacion 
para comprobar si nuestro objeto es menor, mayor o igual al objeto 
pasado como parametro. Debe devolver un numero negativo si nuestro 
objeto es menor, cero si son iguales, y un numero positivo si nuestro 
objeto es mayor. Si este metodo no esta definido y se intenta com- 
parar el objeto mediante los operadores <, <=, > o >= se lanzara una 
excepcion. Si se utilizan los operadores == o ! = para comprobar si dos 
objetos son iguales, se comprueba si son el mismo objeto (si tienen el 
mismo id). 

len (self) 

Metodo llamado para comprobar la longitud dei objeto. Se utiliza, por 
ejemplo, cuando se llama a la funcion len(ob j ) sobre nuestro objeto. 
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Como es de suponer, el metodo debe devolver el numero la longitud 
dei objeto. 



Existen bastantes mas metodos especiales, que permite entre otras 
cosas utilizar el mecanismo de slicing sobre nuestro objeto, utilizar 
los operadores aritmeticos o usar la sintaxis de diccionarios, pero un 
estudio exhaustivo de todos los metodos queda fuera dei proposito dei 
capitulo. 
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En los capitulos dedicados a los tipos simples y las colecciones veiamos 
por primera vez algunos de los objetos dei lenguaje Python: numeros, 
booleanos, cadenas de texto, diccionarios, listas y tuplas. 

Ahora que sabemos que son las clases, los objetos, las funciones, y los 
metodos es el momento de revisitar estos objetos para descubrir su 
verdadero potencial. 

Veremos a continuacion algunos metodos utiles de estos objetos. Evi- 
dentemente, no es necesario memorizarlos, pero si, al menos, recordar 
que existen para cuando sean necesarios. 

Diccionarios 

D.has_key(k) 

Comprueba si el diccionario tiene la clave k. Es equivalente a la sin- 
taxis k in D. 

D. items( ) 

Devuelve una lista de tuplas con pares clave-valor. 

D . keys( ) 

Devuelve una lista de las claves dei diccionario. 

D ■ pop ( k [ , d]) 

Borra la clave k dei diccionario y devuelve su valor. Si no se encuentra 
dicha clave se devuelve d si se especifko el parametro o bien se lanza 
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una excepcion. 

D. values( ) 

Devuelve una lista de los valores dei diccionario. 



Cadenas 

S.count(sub[ , star t [ , end ] ] ) 

Devuelve el numero de veces que se encuentra sub en la cadena. Los 
parametros opcionales start y end definen una subcadena en la que 
buscar. 

S . f i nd ( sub [ , start [ , end]]) 

Devuelve la posicion en la que se encontro por primera vez sub en la 
cadena o -1 si no se encontro. 

S . join( sequence) 

Devuelve una cadena resultante de concatenar las cadenas de la se- 
cuencia seq separadas por la cadena sobre la que se llama el metodo. 

S.partition(sep) 

Busca el separador sep en la cadena y devuelve una tupla con la sub- 
cadena hasta dicho separador, el separador en si, y la subcadena dei 
separador hasta el final de la cadena. Si no se encuentra el separador, la 
tupla contendra la cadena en si y dos cadenas vadas. 

S.replace(old, new[ , count]) 

Devuelve una cadena en la que se han reemplazado todas las ocurren- 
cias de la cadena old por la cadena new. Si se especifica el parametro 
count, este indica el numero maximo de ocurrencias a reemplazar. 

S . spl i t ( [ sep [ , maxspl it]]) 

Devuelve una lista conteniendo las subcadenas en las que se divide 
nuestra cadena al dividirlas por el delimitador sep. En el caso de que 
no se especifique sep, se usan espacios. Si se especifica maxspl it, este 
indica el numero maximo de particiones a realizar. 



Listas 

L . append(ob ject ) 
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Anade un objeto al final de la lista. 

L.count(value) 

Devuelve el numero de veces que se encontro value en la lista. 

L . extend( iterable) 

Anade los elementos dei iterable a la lista. 

L . index(value[ , startf, s top ] ] ) 

Devuelve la posicion en la que se encontro la primera ocurrencia de 
value. Si se especifican, start y stop definen las posiciones de inicio y 
fin de una sublista en la que buscar. 

L . insert ( index , object) 

Inserta el objeto object en la posicion index. 

L . pop( [index] ) 

Devuelve el valor en la posicion index y lo elimina de la lista. Si no se 
especifica la posicion, se utiliza el ultimo elemento de la lista. 

L . remove(value) 

Eliminar la primera ocurrencia de value en la lista. 

L . reverse( ) 

Invierte la lista. Esta funcion trabaja sobre la propia lista desde la que 
se invoca el metodo, no sobre una copia. 

L.sort(cmp=None, key=None, reverse=False) 

Ordena la lista. Si se especifica cmp, este debe ser una funcion que tome 
como parametro dos valores x e y de la lista y devuelva -1 si x es menor 
que y, 0 si son iguales y 1 si x es mayor que y. 

El parametro reverse es un booleano que indica si se debe ordenar 
la lista de forma inversa, lo que seria equivalente a llamar primero a 
L . sort ( ) y despues a L . reverse ( ). 

Por ultimo, si se especifica, el parametro key debe ser una funcion que 
tome un elemento de la lista y devuelva una clave a utilizar a la hora de 
comparar, en lugar dei elemento en si. 
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La programacion funcional es un paradigma en el que la programa- 
cion se basa casi en su totalidad en funciones, entendiendo el concepto 
de funcion segun su defmicion matematica, y no como los simples 
subprogramas de los lenguajes imperativos que hemos visto hasta 
ahora. 

En los lenguajes funcionales puros un programa consiste exclusiva- 
mente en la aplicacion de distintas funciones a un valor de entrada 
para obtener un valor de salida. 

Python, sin ser un lenguaje puramente funcional incluye varias caracte- 
risticas tomadas de los lenguajes funcionales como son las funciones de 
orden superior o las funciones lambda (funciones anonimas). 

Funciones de orden superior 

El concepto de funciones de orden superior se refiere al uso de fun- 
ciones como si de un valor cualquiera se tratara, posibilitando el pasar 
funciones como parametros de otras funciones o devolver funciones 
como valor de retorno. 

Esto es posible porque, como hemos insistido ya en varias ocasiones, 
en Python todo son objetos. Y las funciones no son una excepcion. 

Veamos un pequeno ejemplo 

def saludar ( 1 ang ) : 
def saludar_es( ) : 



54 



Programacion funcional 



f = 

fC 



print "Hola" 

def saludar_en( ) : 
print "Hi" 

def saludar_f r( ) : 
print "Salut" 



lang_f unc 



"fr" 



saludar_es , 
saludar_en , 
saludar_fr 



return lang_f unc[ lang] 
saludar ( "es" ) 



Como podemos observar lo primero que hacemos en nuestro pequeno 
programa es llamar a la funcion saludar con un parametro "es". En la 
funcion saludar se definen varias funciones: saludar_es, saludar_eny 
saludar_fr y a continuacion se crea un diccionario que tiene como cla- 
ves cadenas de texto que identifican a cada lenguaje, y como valores las 
funciones. EI valor de retorno de la funcion es una de estas funciones. 
La funcion a devolver viene determinada por el valor dei parametro 
lang que se paso como argumento de saludar. 

Como el valor de retorno de saludar es una funcion, como hemos 
visto, esto quiere decir que f es una variable que contiene una funcion. 
Podemos entonces llamar a la funcion a la que se refiere f de la forma 
en que llamarfamos a cualquier otra funcion, anadiendo unos parente- 
sis y, de forma opcional, una serie de parametros entre los parentesis. 

Esto se podria acortar, ya que no es necesario almacenar la funcion que 
nos pasan como valor de retorno en una variable para poder llamarla: 

»> saludarf "en" ) ( ) 

Hi 

»> saludarf "fr" ) ( ) 

Salut 



En este caso el primer par de parentesis indica los parametros de la 
funcion saludar, y el segundo par, los de la funcion devuelta por salu- 
dar. 
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Iteraciones de orden superior so- 
bre listas 

Una de las cosas mas interesantes que podemos hacer con nuestras 
funciones de orden superior es pasarlas como argumentos de las fun- 
ciones map, fi Iter y reduce. Estas funciones nos permiten sustituir los 
bucles tipicos de los lenguajes imperativos mediante construcciones 
equivalentes. 

map(function. sequence[, sequence, ...]) 

La funcion map aplica una funcion a cada elemento de una secuencia y 
devuelve una lista con el resultado de aplicar la funcion a cada elemen- 
to. Si se pasan como parametros n secuencias, la funcion tendra que 
aceptar n argumentos. Si alguna de las secuencias es mas pequena que 
las demas, el valor que le llega a la funcion function para posiciones 
mayores que el tamano de dicha secuencia sera None. 

A continuacion podemos ver un ejemplo en el que se utiliza map para 
elevar al cuadrado todos los elementos de una lista: 

def cuadrado(n): 
return n ** 2 

1 = [1, 2, 3] 

12 = map(cuadrado, 1) 

filter(function, sequence) 

La funcion f i Iter verifica que los elementos de una secuencia cum- 
plan una determinada condicion, devolviendo una secuencia con los 
elementos que cumplen esa condicion. Es decir, para cada elemento de 
sequence se aplica la funcion function; si el resultado es True se anade 
a la lista y en caso contrario se descarta. 

A continuacion podemos ver un ejemplo en el que se utiliza f i 1 ter 
para conservar solo los numeros que son pares. 

def es_par(n): 

return (n % 2.0 == 0) 

f = [1, 2, 3] 
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12 = filter(es_par , 1) 

reduce(function, sequence[, initial]) 

La funcion reduce aplica una funcion a pares de elementos de una 
secuencia hasta dejarla en un solo valor. 

A continuacion podemos ver un ejemplo en el que se utiliza reduce 
para sumar todos los elementos de una lista. 

def sumar(x, y): 
return x + y 

1 = [ 1 , 2 , 3 ] 

12 = reduce(sumar , 1) 

Funciones lambda 

El operador lambda sirve para crear funciones anonimas en linea. AI ser 
funciones anonimas, es decir, sin nombre, estas no podran ser referen- 
ciadas mas tarde. 

Las funciones lambda se construyen mediante el operador lambda, los 
parametros de la funcion separados por comas (atencion, SIN parente- 
sis), dos puntos ( : ) y el codigo de la funcion. 

Esta construccion podrian haber sido de utilidad en los ejemplos an- 
teriores para reducir codigo. El programa que utilizamos para explicar 
f i 1 1 er , por ejemplo, podria expresarse asi: 

1 = [ 1 , 2 , 3 ] 

12 = filter(lambda n: n % 2.0 == 0, 1) 

Comparemoslo con la version anterior: 

def es_par(n): 

return (n % 2 .0 == 0) 

1 = [ 1 , 2 , 3 ] 

12 = filter(es_par , 1) 

Las funciones lambda estan restringidas por la sintaxis a una sola 
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expresion. 

Comprension de listas 

En Python 3 map y f i Iter se veran sustituidas por las list comprehen- 
sions o comprension de listas, caracteristica tomada dei lenguaje de 
programacion funcional Haskell y que esta presente en Python desde 
la version 2.0. 

La comprension de listas es una construccion que permite crear listas 
a partir de otras listas. Cada una de estas construcciones consta de una 
expresion que determina como modificar el elemento de la lista origi- 
nal, seguida de una o varias clausulas for y opcionalmente una o varias 
clausulas if. 

Veamos un ejemplo de como se podria utilizar la comprension de listas 
para elevar al cuadrado todos los elementos de una lista, como hicimos 
en nuestro ejemplo de map. 

12 = [n ** 2 for n in 1] 

Esta expresion se leeria como “para cada n en 1 haz n ** 2”. Como 
vernos tenemos primero la expresion que modifica los valores de la Usta 
original (n ** 2), despues el for, el nombre que vamos a utilizar para 
referirnos al elemento actual de la lista original, el in,y la lista sobre la 
que se itera. 

El ejemplo que utilizamos para la funcion f i Iter (conservar solo los 
numeros que son pares) se podria expresar con comprension de listas 
asi: 



12 = [n for n in 1 if n % 2.0 == 0] 



Veamos por ultimo un ejemplo de compresion de listas con varias 
clausulas for: 



f = [0, 1, 2, 3] 
m = ["a", "b"] 
n = [s * v for s in m 
for v in 1 
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if v > 0] 



Esta construccion seria equivalente a una serie de for- in anidados: 

1 = [ 0 , 1, 2, 3] 
m = ["a", "b"] 
n = [] 

for s in m: 

for v in 1: 
if v > 0: 

n.append(s* v) 



Generadores 

Las expresiones generadoras funcionan de forma muy similar a la 
comprension de listas. De hecho su sintaxis es exactamente igual, a 
excepcion de que se utilizan parentesis en lugar de corchetes: 

12 = (n ** 2 for n in 1) 



Sin embargo las expresiones generadoras se diferencian de la compren- 
sion de listas en que no se devuelve una lista, sino un generador. 

>>> 12 = [n ** 2 for n in 1] 

»> 12 
[ 0 , 1, 4, 9] 

>>> 12 = (n ** 2 for n in 1) 

>>> 12 

<generator object at 0x00E33210> 



Un generador es una clase especial de funcion que genera valores sobre 
los que iterar. Para devolver el siguiente valor sobre el que iterar se 
utiliza la palabra clave yield en lugar de return. Veamos por ejemplo 
un generador que devuelva numeros de n a m con un salto s. 

def mi_generador(n , m, s): 
while(n <= m) : 
yield n 
n += s 

»> x = mi_generador(0, 5, 1) 

>>> x 

<generator object at 0x00E25710> 
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EI generador se puede utilizar en cualquier lugar donde se necesite un 
objeto iterable. Por ejemplo en un for-in: 

for n in mi_generador(0 , 5, 1): 
print n 

Como no estamos creando una lista completa en memoria, sino gene- 
rando un solo valor cada vez que se necesita, en situaciones en las que 
no sea necesario tener la lista completa el uso de generadores puede 
suponer una gran diferencia de memoria. En todo caso siempre es po- 
sible crear una lista a partir de un generador mediante la funcion 1 ist: 

Usta = list(mi_generador) 



Decoradores 

Un decorador no es es mas que una funcion que recibe una funcion 
como parametro y devuelve otra funcion como resultado. Por ejem- 
plo podriamos querer anadir la funcionalidad de que se imprimiera el 
nombre de la funcion llamada por motivos de depuracion: 

def mi_decorador(funcion) : 
def nueva(*args) : 

print "Llamada a la funcion", funcion. name 

retorno = funcion(*args) 
return retorno 
return nueva 



Como vernos el codigo de la funcion mi_decorador no hace mas que 
crear una nueva funcion y devolverla. Esta nueva funcion imprime el 
nombre de la funcion a la que “decoramos”, ejecuta el codigo de dicha 
funcion, y devuelve su valor de retorno. Es decir, que si llamaramos 
a la nueva funcion que nos devuelve mi_decorador, el resultado seria 
el mismo que el de llamar directamente a la funcion que le pasamos 
como parametro, exceptuando el que se imprimiria ademas el nombre 
de la funcion. 



Supongamos como ejemplo una funcion imp que no hace otra cosa que 
mostrar en pantalla la cadena pasada como parametro. 

»> imp("hola") 
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hola 

»> mi_decorador ( imp) ( "hola" ) 
Llamada a la funcion imp 
hola 



La sintaxis para llamar a la funcion que nos devuelve mi_decorador no 
es muy clara, aunque si lo estudiamos detenidamente veremos que no 
tiene mayor complicacion. Primero se llama a la funcion que decora 
con la funcion a decorar: mi_decorador ( imp); y una vez obtenida la 
funcion ya decorada se la puede llamar pasando el mismo parametro 
que se paso anteriormente: mi_decorador( imp) ( "hola" ) 

Esto se podria expresar mas claramente precediendo la definicion de la 
funcion que queremos decorar con el signo @ seguido dei nombre de la 
funcion decoradora: 

@mi_decorador 
def imp(s): 
print s 

De esta forma cada vez que se llame a imp se estara llamando realmen- 
te a la version decorada. Python incorpora esta sintaxis desde la version 
2.4 en adelante. 



Si quisieramos aplicar mas de un decorador bastaria anadir una nueva 
linea con el nuevo decorador. 

@otro_decorador 
@mi_decorador 
def imp(s): 
print s 



Es importante advertir que los decoradores se ejecutaran de abajo a 
arriba. Es decir, en este ejemplo primero se ejecutaria mi_decorador y 
despues otro_decorador. 
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Las excepciones son errores detectados por Python durante la eje- 
cucion dei programa. Cuando el interprete se encuentra con una 
situacion excepcional, como el intentar dividir un numero entre 0 o 
el intentar acceder a un archivo que no existe, este genera o lanza una 
excepcion, informando al usuario de que existe algun problema. 

Si la excepcion no se captura el flujo de ejecucion se interrumpe y se 
muestra la informacion asociada a la excepcion en la consola de forma 
que el programador pueda solucionar el problema. 



Veamos un pequeno programa que lanzaria una excepcion al intentar 
dividir 1 entre 0. 

def division(a, b): 
return a / b 

def calculari): 
division(1, 0) 

calcular( ) 



Si lo ejecutamos obtendremos el siguiente mensaje de error: 

$ python ejemplo.py 

Traceback (most recent call 1 as t ) : 

File "ejemplo.py", line 7, in 
calcular( ) 

File "ejemplo.py", line 5, in calcular 
divis ion ( 1 , 0) 

File "ejemplo.py", line 2, in division 
a / b 

ZeroDivisionError : integer division or modulo by zero 



Lo primero que se muestra es el trazado de pila o traceback, que con- 
siste en una lista con las llamadas que provocaron la excepcion. Como 
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vemos en el trazado de pila, el error estuvo causado por la llamada a 
calcular( ) de la linea 7, que a su vez llama a division( 1 , 0) en la 
linea 5 y en ultima instanda por la ejecucion de la sentenda a / b de 
la linea 2 de division. 

A continuacion vemos el tipo de la excepcion, ZeroDivionError, junto 
a una descripdon dei error: “integer division or modulo by zero” (mo- 
dulo o division entera entre cero). 

En Python se utiliza una construccion try-except para capturar y 
tratar las excepciones. El bloque try (intentar) define el fragmento de 
codigo en el que creemos que podria producirse una excepcion. El blo- 
que except (excepcion) permite indicar el tratamiento que se llevara a 
cabo de producirse dicha excepcion. Muchas veces nuestro tratamiento 
de la excepcion consistira simplemente en imprimir un mensaje mas 
amigable para el usuario, otras veces nos interesara registrar los errores 
y de vez en cuando podremos establecer una estrategia de resolucion 
dei problema. 

En el siguiente ejemplo intentamos crear un objeto f de tipo fichero. 
De no existir el archivo pasado como parametro, se lanza una excep- 
cion de tipo IOError, que capturamos gracias a nuestro try-except. 

try: 

f = file("archivo.txt") 
except : 

print "El archivo no existe" 

Python permite utilizar varios except para un solo bloque try, de 
forma que podamos dar un tratamiento distinto a la excepcion de- 
pendiendo dei tipo de excepcion de la que se trate. Esto es una buena 
practica, y es tan sencillo como indicar el nombre dei tipo a continua- 
cion dei except. 

try: 

num = int("3a") 
print no_existe 
except NameError: 

print "La variable no existe" 
except ValueError: 

print "El valor no es un numero" 
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Cuando se lanza una excepcion en el bloque try, se busca en cada una 
de las clausulas except un manejador adecuado para el tipo de error 
que se produjo. En caso de que no se encuentre, se propaga la excep- 
cion. 



Ademas podemos hacer que un mismo except sirva para tratar mas 
de una excepcion usando una tupla para listar los tipos de error que 
queremos que trate el bloque: 

try: 

num = int("3a") 
print no_existe 

except (NameError, ValueError ) : 
print "Ocurrio un error" 



La construccion try-except puede contar ademas con una clausula 
e Ise, que define un fragmento de codigo a ejecutar solo si no se ha 
producido ninguna excepcion en el try. 

try: 

num = 33 
except : 

print "Hubo un error ! " 
else : 

print "Todo esta bien" 



Tambien existe una clausula f inally que se ejecuta siempre, se pro- 
duzca o no una excepcion. Esta clausula se suele utilizar, entre otras 
cosas, para tareas de limpieza. 

try: 

z = x / y 

except ZeroDivisionError : 

print "Division por cero" 
f inally : 

print "Limpiando" 



Tambien es interesante comentar que como programadores podemos 
crear y lanzar nuestras propias excepciones. Basta crear una clase que 
herede de Except ion o cualquiera de sus hijas y lanzarla con raise. 

class MiError(Exception) : 

def init (self, valor): 

self . valor = valor 
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def str ( self ) : 

return "Error " + str(self . valor) 

try : 

if resultado > 20: 
raise MiError(33) 
except MiError, e: 
print e 

Por ultimo, a continuacion se listan a modo de referenda las excepcio- 
nes disponibles por defecto, asi como la clase de la que deriva cada una 
de ellas entre parentesis. 

BaseException: Clase de la que heredan todas las excepciones. 

Except ion (BaseExcept ion): Super clase de todas las excepciones que 
no sean de salida. 

GeneratorExit(Exception): Se pide que se salga de un generador. 

StandarError(Exception): Clase base para todas las excepciones que 
no tengan que ver con salir dei interprete. 

ArithmeticError(StandardError): Clase base para los errores aritme- 
ticos. 

FloatingPointError(ArithmeticError): Error en una operacion de 
coma flotante. 

Overf lowError(ArithmeticError): Resultado demasiado grande para 
poder representarse. 

ZeroDivisionError(ArithmeticError ): Lanzada cuando el segundo 
argumento de una operacion de division o modulo era 0. 

AssertionErrorfStandardError ): Fallo la condicion de un estamento 
assert. 

AttributeError(StandardError ): No se encontro el atributo. 
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EOFError(StandardError ): Se intento leer mas alia dei final de fichero. 

EnvironmentError (StandardError ): Clase padre de los errores relacio- 
nados con la entrada/salida. 

IOError(EnvironmentError): Error en una operacion de entrada/salida. 

OSError(EnvironmentError): Error en una llamada a sistema. 

WindowsError(OSError ): Error en una llamada a sistema en Windows. 

ImportError(StandardError ): No se encuentra el modulo o el elemen- 
to dei modulo que se queria importar. 

LookupError(StandardError ): Clase padre de los errores de acceso. 

IndexError (LookupError ): El indice de la secuencia esta fuera dei 
rango posible. 

KeyError(LookupError ): La clave no existe. 

MemoryError(StandardError ): No queda memoria suficiente. 

NameError(StandardError): No se encontro ningun elemento con ese 
nombre. 

UnboundLocalError (NameError ): El nombre no esta asociado a ninguna 
variable. 

ReferenceError (StandardError ): El objeto no tiene ninguna referen- 
da fiierte apuntando hacia el. 

RuntimeError(StandardError): Error en tiempo de ejecucion no espe- 
cificado. 

NotlmplementedError(RuntimeError): Ese metodo o funcion no esta 
implementado. 

SyntaxError(StandardError ): Clase padre para los errores sintacticos. 
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IndentationError(SyntaxError): Error en la indentacion dei archivo. 

TabError( Indent at ionError ): Error debido a la mezcla de espacios y 
tabuladores. 

SystemError(StandardError ): Error interno dei interprete. 

TypeError(StandardError): Tipo de argumento no apropiado. 

ValueError(StandardError): Valor dei argumento no apropiado. 

UnicodeError(ValueError ): Clase padre para los errores relacionados 
con Unicode. 

UnicodeDecodeError (UnicodeError ): Error de decodificacion Unicode. 

UnicodeEncodeError (UnicodeError ): Error de codificacion Unicode. 

UnicodeTranslateError (UnicodeError ): Error de traduccion Unicode. 

StopIteration(Exception): Se utiliza para indicar el final dei iterador. 

Warning(Exception): Clase padre para los avisos. 

DeprecationWarning(Warning): Clase padre para avisos sobre caracte- 
risticas obsoletas. 

FutureWarning(Warning): Aviso. La semantica de la construccion cam- 
biara en un futuro. 

ImportWarning(Warning): Aviso sobre posibles errores a la hora de 
importar. 

PendingDeprecationWarning(Warning): Aviso sobre caracteristicas que 
se marcaran como obsoletas en un futuro proximo. 

RuntimeWarning(Warning): Aviso sobre comportmaientos dudosos en 
tiempo de ejecucion. 
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SyntaxWarning(Warning); Aviso sobre sintaxis dudosa. 

UnicodeWarning(Warning): Aviso sobre problemas relacionados con 
Unicode, sobre todo con problemas de conversion. 

UserWarning(Warning): Clase padre para avisos creados por el progra- 
mador. 

Keyboardlnterrupt(BaseException): El programa fue interrumpido 
por el usuario. 

SystemExit(BaseException): Peticion dei interprete para terminar la 
ejecucion. 
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Modulos 

Para facilitar el mantenimiento y la lectura los programas demasiado 
largos pueden dividirse en modulos, agrupando elementos relaciona- 
dos. Los modulos son entidades que permiten una organizacion y divi- 
sion logica de nuestro codigo. Los ficheros son su contrapartida fisica: 
cada archivo Python almacenado en disco equivale a un modulo. 

Vamos a crear nuestro primer modulo entonces creando un pequeno 
archivo modulo.py con el siguiente contenido: 

def mi_funcion( ) : 

print "una funcion" 

class MiClase: 

def init (self ) : 

print "una clase" 

print "un modulo" 

Si quisieramos utilizar la funcionalidad definida en este modulo en 
nuestro programa tendriamos que importarlo. Para importar un mo- 
dulo se utiliza la palabra clave import seguida dei nombre dei modulo, 
que consiste en el nombre dei archivo menos la extension. Como ejem- 
plo, creemos un archivo programa.py en el mismo directorio en el que 
guardamos el archivo dei modulo (esto es importante, porque si no se 
encuentra en el mismo directorio Python no podra encontrarlo), con el 
siguiente contenido: 

import modulo 
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modulo. mi_funcion( ) 

EI import no solo hace que tengamos disponible todo lo definido 
dentro dei modulo, sino que tambien ejecuta el codigo dei modulo. Por 
esta razon nuestro programa, ademas de imprimir el texto “una fun- 
cion” al llamar a mi_f uncion, tambien imprimiria el texto “un modulo”, 
debido al print dei modulo importado. No se imprimiria, no obstante, 
el texto “una clase”, ya que lo que se hizo en el modulo fue tan solo 
definir de la clase, no instanciarla. 

La clausula import tambien permite importar varios modulos en la 
misma linea. En el siguiente ejemplo podemos ver como se importa 
con una sola clausula import los modulos de la distribucion por defecto 
de Python os, que engloba funcionalidad relativa al sistema operativo; 
sys, con funcionalidad relacionada con el propio interprete de Python 
y time, en el que se almacenan funciones para manipular fechas y 
horas. 

import os, sys, time 
print time . asctime( ) 

Sin duda os habreis fijado en este y el anterior ejemplo en un detalle 
importante, y es que, como vernos, es necesario preceder el nombre de 
los objetos que importamos de un modulo con el nombre dei modulo 
al que pertenecen, o lo que es lo mismo, el espacio de nombres en el 
que se encuentran. Esto permite que no sobreescribamos accidental- 
mente algun otro objeto que tuviera el mismo nombre al importar otro 
modulo. 

Sin embargo es posible utilizar la construccion from- import para 
ahorrarnos el tener que indicar el nombre dei modulo antes dei objeto 
que nos interesa. De esta forma se importa el objeto o los objetos que 
indiquemos al espacio de nombres actual. 

from time import asctime 
print asctime() 
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Aunque se considera una mala practica, tambien es posible importar 
todos los nombres dei modulo al espacio de nombres actual usando el 
caracter *: 

from time import * 

Ahora bien, recordareis que a la hora de crear nuestro primer modulo 
insisti en que lo guardarais en el mismo directorio en el que se en- 
contraba el programa que lo importaba. Entonces, Reorno podemos 
importar los modulos os, sys o time si no se encuentran los archivos 
os . py, sys . py y t ime . py en el mismo directorio? 

A la hora de importar un modulo Python recorre todos los directorios 
indicados en la variable de entorno PYTHONPATH en busca de un archivo 
con el nombre adecuado. El valor de la variable PYTHONPATH se puede 
consultar desde Python mediante sys . path 

»> import sys 
»> sys. path 

De esta forma para que nuestro modulo estuviera disponible para 
todos los programas dei sistema bastaria con que lo copiaramos a uno 
de los directorios indicados en PYTHONPATH. 

En el caso de que Python no encontrara ningun modulo con el nom- 
bre especificado, se lanzaria una excepcion de tipo ImportError. 

Por ultimo es interesante comentar que en Python los modulos 
tambien son objetos; de tipo module en concreto. Por supuesto esto 
significa que pueden tener atributos y metodos. Uno de sus atribu- 

tos, name , se utiliza a menudo para incluir codigo ejecutable en un 

modulo pero que este solo se ejecute si se llama al modulo como pro- 
grama, y no al importarlo. Para lograr esto basta saber que cuando se 

ejecuta el modulo directamente name tiene como valor " main ", 

mientras que cuando se importa, el valor de name es el nombre dei 

modulo: 

print "Se muestra siempre" 

if name == " main 

print "Se muestra si no es importacion" 
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Otro atributo interesante es doc , que, como en el caso de fun- 

ciones y clases, sirve a modo de documentacion dei objeto (docstring 
o cadena de documentacion). Su valor es el de la primera linea dei 
cuerpo dei modulo, en el caso de que esta sea una cadena de texto; en 
caso contrario valdra None. 

Paquetes 

Si los modulos sirven para organizar el codigo, los paquetes sirven para 
organizar los modulos. Los paquetes son tipos especiales de modulos 
(ambos son de tipo module) que permiten agrupar modulos relacio- 
nados. Mientras los modulos se corresponden a nivei fisico con los 
archivos, los paquetes se representan mediante directorios. 

En una aplicacion cualquiera podriamos tener, por ejemplo, un paque- 
te iu para la interfaz o un paquete bbdd para la persistenda a base de 
datos. 

Para hacer que Python trate a un directorio como un paquete es nece- 

sario crear un archivo init .py en dicha carpeta. En este archivo se 

pueden definir elementos que pertenezcan a dicho paquete, como una 
constante DRIVER para el paquete bbdd, aunque habitualmente se trata- 
ra de un archivo vacio. Para hacer que un cierto modulo se encuentre 
dentro de un paquete, basta con copiar el archivo que define el modulo 
al directorio dei paquete. 

Como los modulos, para importar paquetes tambien se utiliza import 
y f rom- import y el caracter . para separar paquetes, subpaquetes y 
modulos. 

import paq.subpaq. modulo 
paq . subpaq. modulo . f unc( ) 
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Nuestros programas serian de muy poca utilidad si no fueran capaces 
de interaccionar con el usuario. En capitulos anteriores vimos, de pasa- 
da, el uso de la palabra clave print para mostrar mensajes en pantalla. 

En esta leccion, ademas de describir mas detalladamente dei uso de 
print para mostrar mensajes al usuario, aprenderemos a utilizar las 
funciones input y raw_input para pedir informacion, asi' como los 
argumentos de linea de comandos y, por ultimo, la entrada/salida de 
ficheros. 



Entrada estandar 

La forma mas sencilla de obtener informacion por parte dei usuario 
es mediante la funcion raw_input. Esta funcion torna como parame- 
tro una cadena a usar como prompt (es decir, como texto a mostrar al 
usuario pidiendo la entrada) y devuelve una cadena con los caracteres 
introducidos por el usuario hasta que pulso la tecla Enter. Veamos un 
pequeno ejemplo: 

nombre = raw_input( "Como te Hamas? ") 
print "Encantado, " + nombre 

Si necesitaramos un entero como entrada en lugar de una cadena, por 
ejemplo, podriamos utilizar la funcion int para convertir la cadena a 
entero, aunque seria conveniente tener en cuenta que puede lanzarse 
una excepcion si lo que introduce el usuario no es un numero. 

try : 

edad = raw_input ( "Cuantos anyos tienes? ") 
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dias = int(edad) * 365 
print "Has vivido " + str(dias) + " dias" 
except ValueError: 

print "Eso no es un numero" 

La funcion input es un poco mas complicada. Lo que hace esta fun- 
cion es utilizar raw_input para leer una cadena de la entrada estandar, 
y despues pasa a evaluarla como si de codigo Python se tratara; por lo 
tanto input deberia tratarse con sumo cuidado. 

Parametros de Irnea de comando 

Ademas dei uso de input y raw_input el programador Python cuen- 
ta con otros metodos para obtener datos dei usuario. Uno de ellos es 
el uso de parametros a la hora de llamar al programa en la linea de 
comandos. Por ejemplo: 

python editor. py hola.txt 

En este caso hola.txt seria el parametro, al que se puede acceder a 
traves de la lista sys . argv, aunque, como es de suponer, antes de poder 
utilizar dicha variable debemos importar el modulo sys. sys . argv[0] 
contiene siempre el nombre dei programa tal como lo ha ejecutado el 
usuario, sys . argvf 1 ], si existe, seria el primer parametro; sys . argv[2] 
el segundo, y asi sucesivamente. 

import sys 

if ( len(sys . argv) > 1 ) : 

print "Abriendo " + sys.argv[1] 
else : 

print "Debes indicar el nombre dei archivo" 

Existen modulos, como optparse, que faciUtan el trabajo con los argu- 
mentos de la linea de comandos, pero explicar su uso queda fuera dei 
objetivo de este capitulo. 

Salida estandar 

La forma mas sencilla de mostrar algo en la salida estandar es median- 
te el uso de la sentencia print, como hemos visto multi tud de veces en 
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ejemplos anteriores. En su forma mas basica a la palabra clave print le 
sigue una cadena, que se mostrara en la sali da estandar al ejecutarse el 
estamento. 

»> print "Hola mundo" 

Hola mundo 

Despues de imprimir la cadena pasada como parametro el puntero se 
situa en la siguiente linea de la pantalla, por lo que el print de Python 
funciona igual que el println de Java. 

En algunas funciones equivalentes de otros lenguajes de programacion 
es necesario anadir un caracter de nueva linea para indicar explicita- 
mente que queremos pasar a la siguiente linea. Este es el caso de la 
funcion printf de C o la propia funcion print de Java. 

Ya explicamos el uso de estos caracteres especiales durante la explica- 
cion dei tipo cadena en el capitulo sobre los tipos basicos de Python. 
La siguiente sentencia, por ejemplo, imprimiria la palabra “Hola”, 
seguida de un renglon vado (dos caracteres de nueva linea, 1 \ n 1 ), y 
a continuacion la palabra “mundo” indentada (un caracter tabulador, 

' \t '). 

print "Hola\n\n\tmundo" 

Para que la siguiente impresion se realizara en la misma linea tendria- 
mos que colocar una coma al final de la sentencia. Comparemos el 
resultado de este codigo: 

»> for i in range(3) : 

»> . . . print i , 

0 1 2 

Con el de este otro, en el que no utiliza una coma al final de la senten- 
cia: 



»> for i in range(3) : 
>>> ... print i 
0 
1 
2 
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Este mecanismo de colocar una coma al final de la sentencia funcio- 
na debido a que es el simbolo que se utiliza para separar cadenas que 
queramos imprimir en la misma linea. 

»> print "Hola", "mundo" 

Hola mundo 



Esto se diferencia dei uso dei operador + para concatenar las cadenas 
en que al utilizar las comas print introduce automaticamente un espa- 
cio para separar cada una de las cadenas. Este no es el caso al utilizar 
el operador +,ya que lo que le llega a print es un solo argumento: una 
cadena ya concatenada. 

»> print "Hola" + "mundo" 

Holamundo 



Ademas, al utilizar el operador + tendriamos que convertir antes cada 
argumento en una cadena de no serio ya, ya que no es posible concate- 
nar cadenas y otros tipos, mientras que al usar el primer metodo no es 
necesaria la conversion. 

»> print "Cuesta", 3, "euros" 

Cuesta 3 euros 

»> print "Cuesta" + 3 + "euros" 

<type 'exceptions.TypeError'>: cannot concatenate 'str' and 
'int' objects 



La sentencia print, o mas bien las cadenas que imprime, permiten 
tambien utilizar tecnicas avanzadas de formateo, de forma similar al 
sprintf de C. Veamos un ejemplo bastante simple: 

print "Hola %s" % "mundo" 
print "%s %s" % ("Hola", "mundo") 



Lo que hace la primera linea es introducir los valores a la derecha dei 
simbolo % (la cadena "mundo") en las posiciones indicadas por los espe- 
cificadores de conversion de la cadena a la izquierda dei simbolo %, tras 
convertirlos al tipo adecuado. 



En la segunda linea, vernos como se puede pasar mas de un valor a 
sustituir, por medio de una tupla. 
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En este ejemplo solo tenemos un especificador de conversion: %s. 

Los especificadores mas sencillos estan formados por el simbolo % 
seguido de una letra que indica el tipo con el que formatear el valor 
Por ejemplo: 



Especificador 


Formato 


%s 


Cadena 


%d 


Entero 


%o 


Octal 


%x 


Hexadecimal 


%f 


Real 



Se puede introducir un numero entre el %y el caracter que indica el 
tipo al que formatear, indicando el numero minimo de caracteres que 
queremos que ocupe la cadena. Si el tamano de la cadena resultante 
es menor que este numero, se anadiran espacios a la izquierda de la 
cadena. En el caso de que el numero sea negativo, ocurrira exactamente 
lo mismo, solo que los espacios se anadiran a la derecha de la cadena. 

»> print "%10s mundo" % "Hola" 

Hola mundo 

»> print "%-10s mundo" % "Hola" 

Hola mundo 



En el caso de los reales es posible indicar la precision a utilizar prece- 
diendo la f de un punto seguido dei numero de decimales que quere- 
mos mostrar: 



»> from math import pi 
»> print "%.4f" % pi 
3.1416 



La misma sintaxis se puede utilizar para indicar el numero de caracte- 
res de la cadena que queremos mostrar 

»> print "%.4s" % "hola mundo" 
hola 
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Archivos 



Los ficheros en Python son objetos de tipo file creados mediante la 
funcion open (abrir). Esta funcion toma como parametros una cadena 
con la ruta al fichero a abrir, que puede ser relativa o absoluta; una 
cadena opcional indicando el modo de acceso (si no se especifica se 
accede en modo lectura) y, por ultimo, un entero opcional para especi- 
ficar un tamano de buffer distinto dei utilizado por defecto. 

El modo de acceso puede ser cualquier combinacion logica de los 
siguientes modos: 

• 1 r ' : read, lectura. Abre el archivo en modo lectura. El archivo tiene 
que existir previamente, en caso contrario se lanzara una excepcion 
de tipo IOError. 

• ' w ' : write, escritura. Abre el archivo en modo escritura. Si el archi- 
vo no existe se crea. Si existe, sobreescribe el contenido. 

• ' a ' : append, anadir. Abre el archivo en modo escritura. Se diferen- 
cia dei modo ' w ' en que en este caso no se sobreescribe el conteni- 
do dei archivo, sino que se comienza a escribir al final dei archivo. 

• ' b ' : binary, binario. 

• ' + ' : permite lectura y escritura simultaneas. 

• ' U ' : universal newline, saltos de linea universales. Permite trabajar 
con archivos que tengan un formato para los saltos de linea que no 
coincide con el de la plataforma actual (en Windows se utiliza el 
caracter CR LF, en Unix LF y en Mac OS CR). 

f = open("archivo.txt", "w") 

Tras crear el objeto que representa nuestro archivo mediante la funcion 
open podremos realizar las operaciones de lectura/ escritura pertinen- 
tes utilizando los metodos dei objeto que veremos en las siguientes 
secciones. 

Una vez terminemos de trabajar con el archivo debemos cerrarlo utili- 
zando el metodo close. 

Lectura de archivos 
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Para la lectura de archivos se utilizan los metodos read, readline y 
realines. 

EI metodo read devuelve una cadena con el contenido dei archivo o 
bien el contenido de los primeros n bytes, si se especifica el tamano 
maximo a leer. 

completo = f.read() 
parte = f2.read(512) 

El metodo readline sirve para leer las lineas dei fichero una por una. 
Es decir, cada vez que se llama a este metodo, se devuelve el conteni- 
do dei archivo desde el puntero hasta que se encuentra un caracter de 
nueva linea, incluyendo este caracter. 

while True: 

linea = f.readline() 
if not linea: break 
print line 

Por ultimo, readlines, funciona leyendo todas las lineas dei archivo y 
devolviendo una lista con las lineas leidas. 

Escritura de archivos 

Para la escritura de archivos se utilizan los metodo write y writelines. 
Mientras el primero funciona escribiendo en el archivo una cadena de 
texto que torna como parametro, el segundo torna como parametro una 
lista de cadenas de texto indicando las lineas que queremos escribir en 
el fichero. 

Mover el puntero de lectura/escritura 

Hay situaciones en las que nos puede interesar mover el puntero de 
lectura/escritura a una posicion determinada dei archivo. Por ejemplo 
si queremos empezar a escribir en una posicion determinada y no al 
final o al principio dei archivo. 

Para esto se utiliza el metodo seek que torna como parametro un nu- 
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mero positivo o negativo a utilizar como desplazamiento. Tambien es 
posible utilizar un segundo parametro para indicar desde donde quere- 
mos que se haga el desplazamiento: 0 indicara que el desplazamiento 
se refiere al principio dei fichero (comportamiento por defecto), 1 se 
refiere a la posicion actual, y 2, al final dei fichero. 

Para determinar la posicion en la que se encuentra actualmente el 
puntero se utiliza el metodo teli ( ), que devuelve un entero indicando 
la distanda en bytes desde el principio dei fichero. 
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Las expresiones regulares, tambien llamadas regex o regexp, consisten 
en patrones que describen conjuntos de cadenas de caracteres. 

Algo parecido seria escribir en la linea de comandos de Windows 
dir *.exe 

' * . exe ' seria una “expresion regular” que describiria todas las cadenas 
de caracteres que empiezan con cualquier cosa seguida de ‘.exe’, es 
decir, todos los archivos exe. 

EI trabajo con expresiones regulares en Python se realiza mediante el 
modulo re, que data de Python 1.5 y que proporciona una sintaxis para 
la creacion de patrones similar a la de Perl. En Python 1.6 el modulo 
se reescribio para dotarlo de soporte de cadenas Unicode y mejorar su 
rendimiento. 

El modulo re contiene funciones para buscar patrones dentro de una 
cadena (search), comprobar si una cadena se ajusta a un determinado 
criterio deserito mediante un patron (mateh), dividir la cadena usando 
las ocurrencias dei patron como puntos de ruptura (spl it) o para sus- 
tituir todas las ocurrencias dei patron por otra cadena (sub). Veremos 
estas funciones y alguna mas en la proxima seccion, pero por ahora, 
aprendamos algo mas sobre la sintaxis de las expresiones regulares. 

Patrones 

La expresion regular mas sencilla consiste en una cadena simple, que 
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describe un conjunto compuesto tan solo por esa misma cadena. Por 
ejemplo, veamos como la cadena "python" coincide con la expresion 
regular "python" usando la funcion match: 

import re 

if re.match("python" , "python"): 
print "cierto" 

Si quisieramos comprobar si la cadena es "python", " jython", 

"cython" o cualquier otra cosa que termine en "ython", podriamos 
utilizar el caracter comodin, el punto ' . 1 : 

re .match( ython" , "python") 
re. match(" .ython" , "jython") 

La expresion regular " .ython" describiria a todas las cadenas que con- 
sistan en un caracter cualquiera, menos el de nueva linea, seguido de 
"ython". Un caracter cualquiera y solo uno. No cero, ni dos, ni tres. 

En el caso de que necesitaramos el caracter ' . ' en la expresion regular, 
o cualquier otro de los caracteres especiales que veremos a continua- 
cion, tendriamos que escaparlo utilizando la barra invertida. 

Para comprobar si la cadena consiste en 3 caracteres seguidos de un 
punto, por ejemplo, podriamos utilizar lo siguiente: 

re.match(" . . A. ", "abc. ") 

Si necesitaramos una expresion que solo resultara cierta para las cade- 
nas "python", "jython" y "cython" y ninguna otra, podriamos utilizar 
el caracter ' I ' para expresar alternativa escribiendo los tres subpatro- 
nes completos: 

re .match ( "python I jython I cython" , "python" ) 

o bien tan solo la parte que pueda cambiar, encerrada entre parentesis, 
formando lo que se conoce como un grupo. Los grupos tienen una 
gran importanda a la hora de trabajar con expresiones regulares y este 
no es su unico uso, como veremos en la siguiente seccion. 
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re.match("(pl j lc)ython" , "python") 

Otra opcion consistiria en encerrar los caracteres ' p ' , ' j ' y ' c 1 entre 
corchetes para formar una clase de caracteres, indicando que en esa po- 
sicion puede colocarse cualquiera de los caracteres de la clase. 

re.matchf " [p jcjython" , "python" ) 

<jY si quisieramos comprobar si la cadena es "python®", "pythoni ", 
"python2", ... , "python9"? En lugar de tener que encerrar los 10 digitos 
dentro de los corchetes podemos utilizar el guion, que sirve para indi- 
car rangos. Por ejemplo a-d indicaria todas las letras minusculas de la 
'a' ala ' d ' ; 0-9 serian todos los numeros de 0 a 9 inclusive. 

re.match( "python [0-9]" , "python©") 

Si quisieramos, por ejemplo, que el ultimo caracter fuera o un digito o 
una letra simplemente se escribirian dentro de los corchetes todos los 
criterios, uno detras de otro. 

re.matchf "python [0-9a-zA-Z]" , "pythonp") 

Es necesario advertir que dentro de las clases de caracteres los caracte- 
res especiales no necesitan ser escapados. Para comprobar si la cadena 
es "python . " o "python , ", entonces, escribiriamos: 

re.match("python[ . "python. ") 
y no 

re.match("python[\. , "python. ") 

ya que en este ultimo caso estariamos comprobando si la cadena es 
"python. ", "python, " o "pythonV. 

Los conjuntos de caracteres tambien se pueden negar utilizando el 
simbolo ' ^ 1 . La expresion "python [ A0-9a-z] ", por ejemplo, indicaria 
que nos interesan las cadenas que comiencen por "python" y tengan 
como ultimo caracter algo que no sea ni una letra minuscula ni un 
numero. 
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re.match( "python [ a® - 9a-z] " , "python+" ) 

EI uso de [ 0 - 9 ] para referirse a un digito no es muy comun, ya que, al 
ser la comprobacion de que un caracter es un digito algo muy utilizado, 
existe una secuencia especial equivalente: 1 \ d ' . Existen otras secuen- 
cias disponibles que listamos a continuacion: 

• " \d " : un digito. Equivale a [ 0 - 9 ] 

• " \D " : cualquier caracter que no sea un digito. Equivale a [ A 0 - 9 ] 

• "\w": cualquier caracter alfanumerico. Equivale a [a-zA-Z0-9_] 

• " \W" : cualquier caracter no alfanumerico. Equivale a [ A a - zA- 
Z0-9_] 

• "\s": cualquier caracter en blanco. Equivale a [ \t\n\r\f\v] 

• "\S": cualquier caracter que no sea un espacio en blanco. Equivale 
a [a \t\n\r\f\v] 

Veamos ahora como representar repeticiones de caracteres, dado que 
no seria de mucha utilidad tener que, por ejemplo, escribir una expre- 
sion regular con 30 caracteres ' \d ' para buscar numeros de 30 digitos. 
Para este menester tenemos los caracteres especiales +, * y ?, ademas de 
las llaves { } . 

EI caracter + indica que lo que tenemos a la izquierda, sea un carac- 
ter como ' a ' , una clase como ' [ abc ] ' o un subpatron como ( abc ) , 
puede encontrarse una o mas veces. Por ejemplo la expresion regular 
"python+" describiria las cadenas "python", "pythonn" y "pythonnn", 
pero no "pytho", ya que debe haber al menos una n. 

EI caracter * es similar a +, pero en este caso lo que se situa a su iz- 
quierda puede encontrarse cero o mas veces. 

EI caracter ? indica opcionalidad, es decir, lo que tenemos a la izquier- 
da puede o no aparecer (puede aparecer 0 o 1 veces). 

Fmalmente las llaves sirven para indicar el numero de veces exacto que 
puede aparecer el caracter de la izquierda, o bien un rango de veces que 
puede aparecer. Por ejemplo {3} indicaria que tiene que aparecer exac- 
tamente 3 veces, {3,8} indicaria que tiene que aparecer de 3 a 8 veces, 
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{ , 8 } de 0 a 8 veces y { 3 , } tres veces o mas (las que sean). 

Otro elemento interesante en las expresiones regulares, para terminar, 
es la especificacion de las posiciones en que se tiene que encontrar la 
cadena, esa es la utilidad de A y $, que indican, respectivamente, que el 
elemento sobre el que actuan debe ir al principio de la cadena o al final 
de esta. 

La cadena "http : //mundogeek . net ", por ejemplo, se ajustaria a la 
expresion regular " A http", mientras que la cadena "El protocolo es 
http" no lo haria, ya que el http no se encuentra al principio de la 
cadena. 

Usando el modulo re 

Ya hemos visto por encima como se utiliza la funcion match dei modu- 
lo re para comprobar si una cadena se ajusta a un determinado patron. 
El primer parametro de la funcion es la expresion regular, el segundo, 
la cadena a comprobar y existe un tercer parametro opcional que con- 
tiene distintos flags que se pueden utilizar para modificar el comporta- 
miento de las expresiones regulares. 

Algunos ejemplos de flags dei modulo re son re . IGNORECASE, que hace 
que no se tenga en cuenta si las letras son mayusculas o minusculas o 
re .VERBOSE, que hace que se ignoren los espacios y los comentarios en 
la cadena que representa la expresion regular. 

El valor de retorno de la funcion sera None en caso de que la cadena no 
se ajuste al patron o un objeto de tipo MatchOb ject en caso contrario. 
Este objeto MatchObject cuenta con metodos start y end que devuel- 
ven la posicion en la que comienza y finaliza la subcadena reconocida y 
metodos group y groups que permiten acceder a los grupos que propi- 
ciaron el reconocimiento de la cadena. 

Al llamar al metodo group sin parametros se nos devuelve el grupo 0 
de la cadena reconocida. El grupo 0 es la subcadena reconocida por 
la expresion regular al completo, aunque no existan parentesis que 
delimiten el grupo. 
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»> mo = re .match( "http : // . +\net " , "http://mundogeek.net") 
»> print mo.group() 
http : //mundogeek . net 



Podriamos crear grupos utilizando los parentesis, como aprendimos 
en la seccion anterior, obteniendo asi' la parte de la cadena que nos 
interese. 

»> mo = re.match("http://( ,+)\net" , "http://mundogeek.net") 

»> print mo.group(0) 

http : //mundogeek . net 

»> print mo . group( 1 ) 

mundogeek 



EI metodo groups, por su parte, devuelve una lista con todos los gru- 
pos, exceptuando el grupo 0, que se omite. 

»> mo = re.match( "http: //( .+)\( . {3} ) " , "http : //mundogeek . 
net") 

»> print mo.groups( ) 

( 'mundogeek 1 , ' net 1 ) 



La funcion search dei modulo re funciona de forma similar a match; 
contamos con los mismos parametros y el mismo valor de retorno. 

La unica diferencia es que al utilizar match la cadena debe ajustarse al 
patron desde el primer caracter de la cadena, mientras que con search 
buscamos cualquier parte de la cadena que se ajuste al patron. Por esta 
razon el metodo start de un objeto MatchObject obtenido mediante la 
funcion match siempre devolvera 0, mientras que en el caso de search 
esto no tiene por que ser asi. 

Otra funcion de busqueda dei modulo re es f indall. Este torna los 
mismos parametros que las dos funciones anteriores, pero devuelve una 
lista con las subcadenas que cumplieron el patron. 

Otra posibilidad, si no queremos todas las coincidencias, es utilizar 
f inditer, que devuelve un iterador con el que consultar uno a uno los 
distintos MatchObject. 



Las expresiones regulares no solo permiten realizar busquedas o 
comprobaciones, sino que, como comentamos anteriormente, tambien 
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tenemos fiinciones disponibles para dividir la cadena o realizar reem- 
plazos. 

La funcion split sin ir mas lejos toma como parametros un patron, 
una cadena y un entero opcional indicando el numero maximo de 
elementos en los que queremos dividir la cadena, y utiliza el patron a 
modo de puntos de separacion para la cadena, devolviendo una lista 
con las subcadenas. 

La funcion sub toma como parametros un patron a sustituir, una 
cadena que usar como reemplazo cada vez que encontremos el patron, 
la cadena sobre la que realizar las sustituciones, y un entero opcional 
indicando el numero maximo de sustituciones que queremos realizar. 

AI llamar a estos metodos lo que ocurre en realidad es que se crea un 
nuevo objeto de tipo RegexObject que representa la expresion regular, y 
se llama a metodos de este objeto que tienen los mismos nombres que 
las funciones dei modulo. 

Si vamos a utilizar un mismo patron varias veces nos puede interesar 
crear un objeto de este tipo y llamar a sus metodos nosotros mismos; 
de esta forma evitamos que el interprete tenga que crear un nuevo 
objeto cada vez que usemos el patron y mejoraremos el rendimiento de 
la aplicacion. 

Para crear un objeto RegexObject se utiliza la funcion compile dei 
modulo, al que se le pasa como parametro la cadena que representa el 
patron que queremos utilizar para nuestra expresion regular y, opcio- 
nalmente, una serie de flags de entre los que comentamos anterior- 
mente. 
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La comunicacion entre distintas entidades en una red se basa en 
Python en el clasico concepto de sockets. Los sockets son un concepto 
abstracto con el que se designa al punto final de una conexion. 

Los programas utilizan sockets para comunicarse con otros programas, 
que pueden estar situados en computadoras distintas. 

Un socket queda definido por la direccion IP de la maquina, el puerto 
en el que escucha, y el protocolo que utiliza. 

Los tipos y funciones necesarios para trabajar con sockets se encuen- 
tran en Python en el modulo socket, como no podria ser de otra 
forma. 

Los sockets se clasifican en sockets de flujo (socket . SOCK_STREAM) o 
sockets de datagramas (socket .SOCK_DGRAM) dependiendo de si el ser- 
vicio utiliza TCP, que es orientado a conexion y fiable, o UDP, respec- 
tivamente. En este capitulo solo cubriremos los sockets de flujo, que 
cubren un 90% de las necesidades comunes. 

Los sockets tambien se pueden clasificar segun la familia. Tenemos 
sockets UNIX (socket ,AF_UNIX) que se crearon antes de la concepcion 
de las redes y se basan en ficheros, sockets socket . AF_INET que son los 
que nos interesan, sockets socket . AF_INET6 para IPv6, etc. 

Para crear un socket se utiliza el constructor socket . socket ( ) que pue- 
de tomar como parametros opcionales la familia, el tipo y el protocolo. 
Por defecto se utiliza la familia AF_INET y el tipo S0CK_STREAM. 

Veremos durante el resto dei capitulo como crear un par de programas 
cliente y servidor a modo de ejemplo. 
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Lo primero que tenemos que hacer es crear un objeto socket para el 
servidor 

socket_s = socket . socket( ) 

Tenemos ahora que indicar en que puerto se va a mantener a la escu- 
cha nuestro servidor utilizando el metodo bind. Para sockets IP, como 
es nuestro caso, el argumento de bind es una tupla que contiene el 
host y el puerto. El host se puede dejar vado, indicando al metodo que 
puede utilizar cualquier nombre que este disponible. 

socket_s . b i nd ( ( " localhost " , 9999) ) 

Por ultimo utilizamos listen para hacer que el socket acepte conexio- 
nes entrantes y accept para comenzar a escuchar. El metodo listen 
requiere de un parametro que indica el numero de conexiones maximas 
que queremos aceptar; evidentemente, este valor debe ser al menos 1. 

El metodo accept se mantiene a la espera de conexiones entrantes, 
bloqueando la ejecucion hasta que llega un mensaje. 

Cuando llega un mensaje, accept desbloquea la ejecucion, devolviendo 
un objeto socket que representa la conexion dei cliente y una tupla que 
contiene el host y puerto de dicha conexion. 

socket_s . 1 i s t en ( 10) 

socket_c, (host_c, puerto_c) = socket_s . accept( ) 

Una vez que tenemos este objeto socket podemos comunicarnos con 
el cliente a traves suyo, mediante los metodos recv y send (o recvf rom 
y sendfrom en UDP) que permiten recibir o enviar mensajes respec- 
tivamente. El metodo send torna como parametros los datos a enviar, 
mientras que el metodo recv torna como parametro el numero maxi- 
mo de bytes a aceptar. 

recibido = socket_c . recv( 1024) 
print "Recibido: ", recibio 
socket_c . send (recibido) 
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Una vez que hemos terminado de trabajar con el socket, lo cerramos 
con el metodo close. 



Crear un cliente es aun mas sencillo. Solo tenemos que crear el objeto 
socket, utilizar el metodo connect para conectarnos al servidor y uti- 
lizar los metodos send y recv que vimos anteriormente. El argumento 
de connect es una tupla con hosty puerto, exactamente igual que bind. 

socket_c = socket . socket( ) 

socket_c . connect ( ( " localhost " , 9999) ) 

socket_c . send( "hola" ) 



Veamos por ultimo un ejemplo completo. En este ejemplo el cliente 
manda al servidor cualquier mensaje que escriba el usuario y el servi- 
dor no hace mas que repetir el mensaje recibido. La ejecucion termina 
cuando el usuario escribe quit. 



Este seria el codigo dei script servidor: 

import socket 

s = socket . socket ( ) 
s . bind( ( "localhost " , 9999)) 
s . 1 i s ten ( 1 ) 

sc, addr = s.accept() 

while True: 

recibido = sc . recv( 1024) 
if recibido == "quit" : 
break 

print "Recibido:", recibido 
sc.send(recibido) 

print "adios" 

sc . close( ) 
s . close( ) 



Y a continuacion tenemos el dei script cliente: 
view plaincopy to clipboardprint? 



import socket 

s = socket . socket ( ) 
s . connect( ( "localhost" , 9999)) 
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while True: 

mensaje = raw_input("> ") 
s . send(mensa je) 
mensaje == "quit" : 
break 

print "adios" 
s . close( ) 
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Existen dos modulos principales para leer datos de URLs en Python: 
urUibyurllib2.En esta leccion aprenderemos a utilizar u r 11 i b 2 
ya que es mucho mas completo, aunque urllib tiene funcionalidades 
propias que no se pueden encontrar en urllib2, por lo que tambien lo 
tocaremos de pasada. 

urllib2 puede leer datos de una URL usando varios protocolos como 
HTTP, HTTPS, FTP, o Gopher. 

Se utiliza una funcion urlopen para crear un objeto parecido a un 
fichero con el que leer de la URL. Este objeto cuenta con metodos 
como read, readline, readlines y close, los cuales funcionan exac- 
tamente igual que en los objetos file, aunque en realidad estamos 
trabajando con un wrapper que nos abstrae de un socket que se utiliza 
por debajo. 

El metodo read, como recordareis, sirve para leer el “archivo” completo 
o el numero de bytes especificado como parametro, readline para leer 
una linea, y readlines para leer todas las lineas y devolver una lista con 
ellas. 

Tambien contamos con un par de metodos geturl, para obtener la 
URL de la que estamos leyendo (que puede ser util para comprobar si 
ha habido una redireccion) e info que nos devuelve un objeto con las 
cabeceras de respuesta dei servidor (a las que tambien se puede acceder 
mediante el atributo headers). 

import urllib2 
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try : 

f = urllib2.urlopen("http://www. python.org") 
print f.read() 
f . close( ) 

except HTTPError, e: 

print "Ocurrio un error" 
print e.code 
except URLError, e: 

print "Ocurrio un error" 
print e.reason 



AI trabajar con urll ib2 nos podemos encontrar, como vemos, con 
errores de tipo URLError. Si trabajamos con HTTP podemos encon- 
trarnos tambien con errores de la subclase de URLError HTTPError, que 
se lanzan cuando el servidor devuelve un codigo de error HTTP, como 
el error 404 cuando no se encuentra el recurso. Tambien podriamos 
encontrarnos con errores lanzados por la libreria que urllib2 utiliza 
por debajo para las transferendas HTTP: httplib; o con excepciones 
lanzadas por el propio modulo socket. 

La funcion urlopen cuenta con un parametro opcional data con el que 
poder enviar informacion a direcciones HTTP (y solo HTTP) usando 
POST (los parametros se envian en la propia peticion), por ejemplo 
para responder a un formulario. Este parametro es una cadena codifi- 
cada adecuadamente, siguiendo el formato utilizado en las URLs: 

' password=contrase%A4a&usuar io=manuel 1 



Lo mas sencillo para codificar la cadena es utilizar el metodo urlen- 
code de urllib, que acepta un diccionario o una lista de tuplas (clave, 
valor) y genera la cadena codificada correspondiente: 



import urllib, urllib2 

params = urllib . urlencode( { "usuario" : "manuel", 

"password": "contrasena" } ) 

f = urllib2 . urlopen( "http : //ejemplo . com/login" , params) 



Si lo unico que queremos hacer es descargar el contenido de una URL 
a un archivo local, podemos utilizar la funcion urlretrieve de urllib 
en lugar de leer de un objeto creado con urlopen y escribir los datos 
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leidos. 

La funcion urlretrieve toma como parametros la URL a descar- 
gar y, opcionalmente, un parametro f i lename con la ruta local en la 
que guardar el archivo, un parametro data similar al de ur lopen y un 
parametro reporthook con una funcion que utilizar para informar dei 
progreso. 

A excepcion de las ocasiones en las que se utiliza el parametro data 
las conexiones siempre se realizan utilizando GET (los parametros se 
envian en la URL). Para enviar datos usando GET basta con concate- 
nar la cadena resultante de urlencode con la URL a la que nos vamos a 
conectar mediante el simbolo ?. 

params = urllib . urlencode( { "usuario" : "manuel", 

"password": "contrasena" } ) 

f = urllib2 . urlopen! "http : //e iemplo . com/loqin" + 

"?" + params) 

En urllib tambien se utibza una funcion urlopen para crear nuestros 
pseudo-archivos, pero a diferencia de la version de urllib, la funcion 
urlopen de urllib2 tambien puede tomar como parametro un objeto 
Request, en lugar de la URL y los datos a enviar. 

La clase Request define objetos que encapsulan toda la informacion 
relativa a una peticion. A traves de este objeto podemos realizar peti- 
ciones mas complejas, anadiendo nuestras propias cabeceras, como el 
User-Agent. 

El constructor mas sencillo para el objeto Request no toma mas que 
una cadena indicando la URL a la que conectarse, por lo que utilizar 
este objeto como parametro de urlopen seria equivalente a utilizar una 
cadena con la URL directamente. 

Sin embargo el constructor de Request tambien tiene como parame- 
tros opcionales una cadena data para mandar datos por POST y un 
diccionario headers con las cabeceras (ademas de un par de campos 
origin_req_host y unverif iable, que quedan fuera dei proposito dei 
capitulo por ser de raro uso). 



94 



Interactuar con webs 



Veamos como anadir nuestras propias cabeceras utilizando como 
ejemplo la cabecera User- Agent. EI User- Agent es una cabecera que 
sirve para identificar el navegador y sistema operativo que estamos 
utilizando para conectarnos a esa URL. Por defecto urUib2 se identi- 
fica como “Python-urllib/2.5”; si quisieramos identificarnos como un 
Linux corriendo Konqueror por ejemplo, usariamos un codigo similar 
al siguiente: 

ua = "Mozilla/5.0 (compatible; Konqueror/3 . 5 . 8 ; Linux)" 
h = {"User-Agent" : ua} 

r = urllib2 . Request( "http: //www . python .org" , headers=h) 
f = urUib2.urlopen(r) 
print f.read() 

Para personalizar la forma en que trabaja urllib2 podemos instalar un 
grupo de manejadores ( handlers ) agrupados en un objeto de la clase 
OpenerDirector ( opener o abridor), que sera el que se utilice a partir de 
ese momento al llamar a urlopen. 

Para construir un opener se utiliza la funcion build_opener a la que se 
le pasa los manejadores que formaran parte dei opener. El opener se 
encargara de encadenar la ejecucion de los distintos manejadores en el 
orden dado. Tambien se puede usar el constructor de OpenerDirector, 
y anadir los manejadores usando su metodo add_handler. 

Para instalar el opener una vez creado se utiliza la funcion ins- 
tall_opener, que torna como parametro el opener a instalar. Tambien 
se podria, si solo queremos abrir la URL con ese opener una sola vez, 
utilizar el metodo open dei opener. 

urllib2 cuenta con handlers que se encargan de manejar los esquemas 
disponibles (HTTP, HTTPS, ETP), manejar la autenticacion, manejar 
las redirecciones, etc. 

Para anadir autenticacion tendriamos que instalar un opener que in- 
cluyera como manejador HTTPBasicAuthHandler, ProxyBasicAuthHan- 
dler, HTTPDigestAuthHandler y/o ProxyDigestAuthHandler. 

Para utilizar autenticacion HTTP basica, por ejemplo, usariamos 
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HTTPBasicAuthHandler: 

aut_h = urllib2.HTTPBasicAuthHandler() 

aut_h . add_password( "realm" , "host", "usuario", "password") 

opener = urUib2.build_opener(aut_h) 
urllib2. install_opener( opener) 

f = urllib2 . urlopen( "http : //www. python .org" ) 

Si quisieramos especificar un proxy en el codigo tendriamos que 
utilizar un opener que contuviera el manejador ProxyHandler. El 
manejador por defecto incluye una instacia de ProxyHandler construi- 
do llamando al inicializador sin parametros, con lo que se lee la lista 
de proxies a utilizar de la variable de entorno adecuada. Sin embargo 
tambien podemos construir un ProxyHandler pasando como parame- 
tro al inicializador un diccionario cuyas claves son los protocolos y los 
valores, la URL dei proxy a utilizar para dicho protocolo. 

proxy_h = urllib2.ProxyHandler({"http" : "http://miproxy. 
net: 123"}) 

opener = urllib2.build_opener(proxy_h) 
urllib2. install_opener( opener) 

f = urllib2 . urlopen( "http : //www. python .org" ) 

Para que se guarden las cookies que manda HTTP utilizamos el ma- 
nejador HTTPCookieProcessor. 

cookie_h = urllib2 . HTTPCookieProcessor ( ) 

opener = urllib2.build_opener(cookie_h) 
urllib2. install_opener( opener) 

f = urllib2 . urlopen( "http : //www. python .org" ) 

Si queremos acceder a estas cookies o poder mandar nuestras propias 
cookies, podemos pasarle como parametro al inicializador de HTTPCoo- 
kieProcessor un objeto de tipo CookieJar dei modulo cookielib. 

Para leer las cookies mandadas basta crear un objeto iterable a partir 
dei CookieJar (tambien podriamos buscar las cabeceras correspondien- 
tes, pero este sistema es mas claro y sencillo): 
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import urUib2, cookielib 

cookie_j = cookielib. CookieJar() 

cookie_h = urllib2.HTTPCookieProcessor(cookie_j) 

opener = urllib2.build_opener(cookie_h) 
opener . open( "http : //www. python . org" ) 

for num, cookie in enumerate(cookie_j ) : 
print num, cookie. name 
print cookie. value 
print 



En el improbable caso de que necesitaramos anadir una cookie an- 
tes de realizar la conexion, en lugar de conectarnos para que el sitio 
la mande, podriamos utilizar el metodo set_cookie de CookieJar, al 
que le pasamos un objeto de tipo Cookie. El constructor de Cookie, no 
obstante, es bastante complicado. 
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iQue son los procesos y los 
threads? 

Las computadoras serian mucho menos utiles si no pudieramos hacer 
mas de una cosa a la vez. Si no pudieramos, por ejemplo, escuchar 
musica en nuestro reproductor de audio favorito mientras leemos un 
tutorial de Python en Mundo Geek. 

Pero, Reorno se conseguia esto en computadoras antiguas con un solo 
nucleo / una sola CPU? Lo que ocurria, y lo que ocurre ahora, es que 
en realidad no estamos ejecutando varios procesos a la vez (se llama 
proceso a un programa en ejecucion), sino que los procesos se van tur- 
nando y, dada la velocidad a la que ejecutan las instrucciones, nosotros 
tenemos la impresion de que las tareas se ejecutan de forma paralela 
como si tuvieramos multitarea real. 

Cada vez que un proceso distinto pasa a ejecutarse es necesario reali- 
zar lo que se llama un cambio de contexto, durante el cual se salva el 
estado dei programa que se estaba ejecutando a memoria y se carga el 
estado dei programa que va a entrar a ejecutarse. 

En Python podemos crear nuevos procesos mediante la funcion 
os . fork , que ejecuta la llamada al sistema fork, o mediante otras 
funciones mas avanzadas como popen2 . popen2, de forma que nuestro 
programa pueda realizar varias tareas de forma paralela. 

Sin embargo el cambio de contexto puede ser relativamente lento, y 
los recursos necesarios para mantener el estado demasiados, por lo que 
a menudo es mucho mas eficaz utilizar lo que se conoce como threads , 
hilos de ejecucion, o procesos ligeros. 
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Los threads son un concepto similar a los procesos: tambien se trata de 
codigo en ejecucion. Sin embargo los threads se ejecutan dentro de un 
proceso, y los threads dei proceso comparten recursos entre si, como la 
memoria, por ejemplo. 

EI sistema operativo necesita menos recursos para crear y gestionar los 
threads, y al compartir recursos, el cambio de contexto es mas rapido. 
Ademas, dado que los threads comparten el mismo espacio de me- 
moria global, es sencillo compartir informacion entre ellos: cualquier 
variable global que tengamos en nuestro programa es vista por todos 
los threads. 



El GIL 

La ejecucion de los threads en Python esta controlada por el GIL 
(Global Interpreter Lock) de forma que solo un thread puede ejecutar- 
se a la vez, independientemente dei numero de procesadores con el que 
cuente la maquina. Esto posibilita que el escribir extensiones en C para 
Python sea mucho mas sencillo, pero tiene la desventaja de limitar mu- 
cho el rendimiento, por lo que a pesar de todo, en Python, en ocasiones 
nos puede interesar mas utilizar procesos que threads, que no sufren de 
esta limitacion. 

Cada cierto numero de instrucciones de bytecode la maquina virtual 
para la ejecucion dei thread y elige otro de entre los que estaban espe- 
rando. 

Por defecto el cambio de thread se realiza cada 10 instrucciones de 
bytecode, aunque se puede modificar mediante la funcion sys . set - 
checkinterval.Tambien se cambia de thread cuando el hilo se pone a 
dormir con time . sleep o cuando comienza una operacion de entrada / 
salida, las cuales pueden tardar mucho en finalizar, y por lo tanto, de no 
realizar el cambio, tendriamos a la CPU demasiado tiempo sin trabajar 
esperando a que la operacion de E/S terminara. 

Para minimizar un poco el efecto dei GIL en el rendimiento de nues- 
tra aplicacion es conveniente llamar al interprete con el flag -0, lo que 
hara que se genere un bytecode optimizado con menos instrucciones, y, 
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por lo tanto, menos cambios de contexto. Tambien podemos plantear- 
nos el utilizar procesos en lugar de threads, como ya comentamos, uti- 
lizando por ejemplo el modulo Processing; escribir el codigo en el que 
el rendimiento sea critico en una extension en C o utilizar IronPython 
o Jython, que carecen de GIL. 

Threads en Python 

El trabajo con threads se lleva a cabo en Python mediante el modulo 
thread. Este modulo es opcional y dependiente de la plataforma, y 
puede ser necesario, aunque no es comun, recompilar el interprete para 
anadir el soporte de threads. 

Ademas de thread, tambien contamos con el modulo threading que se 
apoya en el primero para proporcionarnos una API de mas alto nivei, 
mas completa, y orientada a objetos. El modulo threading se basa 
ligeramente en el modelo de threads de Java. 

El modulo threading contiene una clase Thread que debemos ex- 
tender para crear nuestros propios hilos de ejecucion. El metodo run 
contendra el codigo que queremos que ejecute el thread. Si queremos 
especificar nuestro propio constructor, este debera llamar a threading . 
Thread. init (self ) para inicializar el objeto correctamente. 

import threading 

class MiThread( threading .Thread) : 

def init (self, num) : 

threading. Thread. init (self) 

self. num = num 

def run(self): 

print "Soy el hilo", self. num 

Para que el thread comience a ejecutar su codigo basta con crear una 
instancia de la clase que acabamos de definir y llamar a su metodo 
start. El codigo dei hilo principal y el dei que acabamos de crear se 
ejecutaran de forma concurrente. 

print "Soy el hilo principal" 
for i in range(0, 10) : 
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t = MiThread(i) 
t . start ( ) 
t- join() 
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EI metodo join se utiliza para que el hilo que ejecuta la llamada se 
bloquee hasta que finalice el thread sobre el que se llama. En este caso 
se utiliza para que el hilo principal no termine su ejecucion antes que 
los hijos, lo cual podria resultar en algunas plataformas en la termina- 
cion de los hijos antes de finalizar su ejecucion. El metodo join puede 
tomar como parametro un numero en coma flotante indicando el 
numero maximo de segundos a esperar. 

Si se intenta llamar al metodo start para una instancia que ya se esta 
ejecutando, obtendremos una excepcion. 

La forma recomendada de crear nuevos hilos de ejecucion consiste en 
extender la clase Thread, como hemos visto, aunque tambien es posible 
crear una instancia de Thread directamente, e indicar como parametros 
dei constructor una clase ejecutable (una clase con el metodo espe- 

cial call ) o una funcion a ejecutar, y los argumentos en una tupla 

(parametro args) o un diccionario (parametro kwargs). 

import threading 

def imprime(num) : 

print "Soy el hilo", num 

print "Soy el hilo principal" 

for i in range(0, 10) : 

t = threading. Thread(target=imprime, args=(i, )) 
t .start ( ) 

Ademas de los parametros target, args y kwargs tambien podemos 
pasar al constructor un parametro de tipo cadena name con el nom- 
bre que queremos que tome el thread (el thread tendra un nombre 
predeterminado aunque no lo especifiquemos); un parametro de tipo 
booleano verbose para indicar al modulo que imprima mensajes sobre 
el estado de los threads para la depuracion y un parametro group, que 
por ahora no admite ningun valor pero que en el futuro se utilizara 
para crear grupos de threads y poder trabajar a nivei de grupos. 
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Para comprobar si un thread sigue ejecutandose, se puede utilizar el 
metodo i sAl i ve. Tambien podemos asignar un nombre al hilo y con- 
sultar su nombre con los metodos setName y getName, respectivamente. 

Mediante la funcion threading. enumerate obtendremos una lista de 
los objetos Thread que se estan ejecutando, incluyendo el hilo principal 
(podemos comparar el objeto Thread con la variable main_thread para 
comprobar si se trata dei hilo principal) y con threading . activeCount 
podemos consultar el numero de threads ejecutandose. 

Los objetos Thread tambien cuentan con un metodo setDaemon que 
torna un valor booleano indicando si se trata de un demonio. La utili- 
dad de esto es que si solo quedan threads de tipo demonio ejecutando- 
se, la aplicacion terminara automaticamente, terminando estos threads 
de forma segura. 

Por ultimo tenemos en el modulo threading una clase Timer que he- 
reda de Thread y cuya utilidad es la de ejecutar el codigo de su metodo 
run despues de un periodo de tiempo indicado como parametro en 
su constructor. Tambien incluye un metodo cancel mediante el que 
cancelar la ejecucion antes de que termine el periodo de espera. 

Sincronizacion 

Uno de los mayores problemas a los que tenemos que enfrentarnos al 
utilizar threads es la necesidad de sincronizar el acceso a ciertos recur- 
sos por parte de los threads. Entre los mecanismos de sincronizacion 
que tenemos disponibles en el modulo threading se encuentran los 
locks, locks reentrantes, semaforos, condiciones y eventos. 

Los locks, tambien llamados mutex (de mutual exclusion), cierres 
de exclusion mutua, cierres o candados, son objetos con dos estados 
posibles: adquirido o libre. Cuando un thread adquiere el candado, los 
demas threads que lleguen a ese punto posteriormente y pidan adqui- 
rirlo se bloquearan hasta que el thread que lo ha adquirido libere el 
candado, momento en el cual podra entrar otro thread. 

El candado se representa mediante la clase Lock. Para adquirir el 
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candado se utiliza el metodo acquire dei objeto, al que se le puede 
pasar un booleano para indicar si queremos esperar a que se libere 
(True) o no (False). Si indicamos que no queremos esperar, el metodo 
devolvera True o False dependiendo de si se adquirio o no el candado, 
respectivamente. Por defecto, si no se indica nada, el hilo se bloquea 
indefinidamente. 

Para liberar el candado una vez hemos terminado de ejecutar el bloque 
de codigo en el que pudiera producirse un problema de concurrenda, 
se utiliza el metodo release. 

lista = [ ] 

lock = threading . Lock( ) 

def anyadir (ob j ) : 
lock . acquire( ) 
lista . append(ob j ) 
lock . release( ) 

def obtener(): 

lock . acquire( ) 
obj = lista. pop() 
lock . release( ) 
return obj 

La clase RLock funciona de forma similar a Lock, pero en este caso el 
candado puede ser adquirido por el mismo thread varias veces, y no 
quedara liberado hasta que el thread llame a release tantas veces como 
llamo a acquire. Como en Lock,y como en todas las primitivas de sin- 
cronizacion que veremos a continuacion, es posible indicar a acquire si 
queremos que se bloquee o no. 

Los semaforos son otra clase de candados. La clase correspondiente, 
Semaphore, tambien cuenta con metodos acquire y release, pero se di- 
ferencia de un Lock normal en que el constructor de Semaphore puede 
tomar como parametro opcional un entero value indicando el numero 
maximo de threads que pueden acceder a la vez a la seccion de codigo 
critico. Si no se indica nada permite el acceso a un solo thread. 

Cuando un thread Hama a acquire, la variable que indica el numero 
de threads que pueden adquirir el semaforo disminuye en 1, porque 
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hemos permitido entrar en la seccion de codigo critico a un hilo mas. 
Cuando un hilo llama a release, la variable aumenta en 1. 

No es hasta que esta variable dei semaforo es 0, que llamar a acquire 
producira un bloqueo en el thread que realizo la peticion, a la espera de 
que algun otro thread llame a release para liberar su plaza. 

Es importante destacar que el valor inicial de la variable tal como lo 
pasamos en el constructor, no es un limite maximo, sino que multiples 
llamadas a release pueden hacer que el valor de la variable sea mayor 
que su valor original. Si no es esto lo que queremos, podemos utiHzar 
la clase BoundedSemaphore en cuyo caso, ahora si, se consideraria un 
error llamar a release demasiadas veces, y se lanzaria una excepcion de 
tipo ValueError de superarse el valor inicial. 

Podriamos utilizar los semaforos, por ejemplo, en un pequeno pro- 
grama en el que multiples threads descargaran datos de una URL, de 
forma que pudieramos limitar el numero de conexiones a realizar al 
sitio web para no bombardear el sitio con cientos de peticiones concu- 
rrentes. 

semaforo = threading . Semaphore(4) 

def descargar(url) : 
semaforo . acquire( ) 
ur 1 1 ib. ur Iret rieve( uri) 
semaforo . release( ) 

Las condiciones (clase Condition) son de utilidad para hacer que los 
threads solo puedan entrar en la seccion critica de darse una cierta 
condicion o evento. Para esto utiHzan un Lock pasado como parametro, 
o crean un objeto RLock automaticamente si no se pasa ningun para- 
metro al constructor. 

Son especialmente adecuadas para el clasico problema de productor- 
consumidor. La clase cuenta con metodos acquire y release, que lla- 
maran a los metodos correspondientes dei candado asociado. Tambien 
tenemos metodos wait, notify y notifyAll. 

El metodo wait debe llamarse despues de haber adquirido el candado 



104 



Threads 



con acquire. Este metodo libera el candado y bloquea al thread hasta 
que una llamada a notify o notifyAU en otro thread le indican que se 
ha cumplido la condicion por la que esperaba. El thread que informa a 
los demas de que se ha producido la condicion, tambien debe llamar a 
acquire antes de llamar a notify o notifyAU. 



Al llamar a not i f y, se informa dei evento a un solo thread, y por tanto 
se despierta un solo thread. Al llamar a notifyAU se despiertan todos 
los threads que esperaban a la condicion. 



Tanto el thread que notifica como los que son notificados tienen que 
terminar liberando el lock con release. 

Usta = [ ] 

cond = threading. Condition( ) 

def consumir(): 
cond . acquire( ) 
cond.wait( ) 
obj = lista.pop() 
cond . release( ) 
return obj 

def producir(ob j ) : 
cond . acquire( ) 

Usta . append(ob j ) 
cond . notify! ) 
cond . release! ) 



Los eventos, implementados mediante al clase Event, son un wra- 
pper por encima de Condit ion y sirven principalmente para coordinar 
threads mediante senales que indican que se ha producido un evento. 
Los eventos nos abstraen dei hecho de que estemos utilizando un Lock 
por debajo, por lo que carecen de metodos acquire y release. 

El thread que debe esperar el evento llama al metodo wait y se blo- 
quea, opcionalmente pasando como parametro un numero en coma 
flotante indicando el numero maximo de segundos a esperar. Otro 
hilo, cuando ocurre el evento, manda la senal a los threads bloqueados 
a la espera de dicho evento utilizando el metodo set. Los threads que 
estaban esperando se desbloquean una vez recibida la senal. El flag que 
determina si se ha producido el evento se puede volver a establecer a 
falso usando ciear. 
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Como vemos los eventos son muy similares a las condiciones, a excep- 
cion de que se desbloquean todos los threads que esperaban el evento y 
que no tenemos que llamar a acquire y release. 

import threading, time 

class MiThread(threading.Thread) : 

def init (self, evento): 

threading. Thread. init (self) 

self . evento = evento 

def run(self): 

print self . getName( ) , "esperando al evento" 
self . evento. wait( ) 

print self . getName( ) , "termina la espera" 

evento = threading. Event() 
tl = MiThread(evento) 

1 1 . start ( ) 

t2 = MiThread(evento) 
t2 . start ( ) 

# Esperamos un poco 
time . sleep(5) 
evento . set ( ) 



Por ultimo, un pequeno extra. Si sois usuarios de Java sin duda estareis 
echando en falta una palabra clave syncronized para hacer que solo 
un thread pueda acceder al metodo sobre el que se utiliza a la vez. Una 
construccion comun es el uso de un decorador para implementar esta 
funcionalidad usando un Lock. Seria algo asi: 

def synchronized( lock) : 
def dec(f): 

def func_dec(*args , **kwargs): 
lock . acquire( ) 
try : 

return f(*args, **kwargs) 
f inally : 

lock . release( ) 
return func_dec 
return dec 

class MyThread( threading . Thread) : 

@synchronized(mi_lock) 
def run(self): 

print "metodo sincronizado" 
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Datos globales independientes 

Como ya hemos comentado los threads comparten las variables 
globales. Sin embargo pueden existir situaciones en las que queramos 
utilizar variables globales pero que estas variables se comporten como 
si fueran locales a un solo thread. Es decir, que cada uno de los threads 
tengan valores distintos independientes, y que los cambios de un deter- 
minado thread sobre el valor no se vean reflejados en las copias de los 
demas threads. 



Para lograr este comportamiento se puede utilizar la clase threading. 
local, que crea un almacen de datos locales. Primero debemos crear 
una instanda de la clase, o de una subclase, para despues almacenar y 
obtener los valores a traves de parametros de la clase. 

datos_locales = threading. local( ) 
datos_locales ,mi_var = "hola" 
print datos_locales .mi_var 



Fijemonos en el siguiente codigo, por ejemplo. Para el hilo principal el 
objeto local tiene un atributo var,ypor lo tanto el print imprime su 
valor sin problemas. Sin embargo para el hilo t ese atributo no existe, y 
por lo tanto lanza una excepcion. 

local = threading . local ( ) 

def f ( ) : 

print local. var 

local .var = "hola" 
t = threading. Thread(target=f) 
print local. var 
t . start ( ) 
t. join() 

Compartir informacion 

Para compartir informacion entre los threads de forma sencilla po- 
demos utilizar la clase Queue .Queue, que implementa una cola (una 
estructura de datos de tipo FIFO) con soporte multihilo. Esta clase 
utiliza las primitivas de threading para ahorrarnos tener que sincroni- 
zar el acceso a los datos nosotros mismos. 
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EI constructor de Queue toma un parametro opcional indicando el 
tamano maximo de la cola. Si no se indica ningun valor no hay limite 
de tamano. 



Para anadir un elemento a la cola se utiliza el metodo put ( item); para 
obtener el siguiente elemento, get( ). Ambos metodos tienen un para- 
metro booleano opcional block que indica si queremos que se espere 
hasta que haya algun elemento en la cola para poder devolverlo o hasta 
que la cola deje de estar llena para poder introducirlo. 

Tambien existe un parametro opcional timeout que indica, en segun- 
dos, el tiempo maximo a esperar. Si el timeout acaba sin poder haber 
realizado la operacion debido a que la cola estaba llena o vada, o bien 
si block era False, se lanzara una excepcion de tipo Queue . Full o 
Queue . Empty, respectivamente. 



Con qsize obtenemos el tamano de la cola y con empty ( ) y f ull ( ) 
podemos comprobar si esta vada o llena. 

q = Queue. Queue() 

class MiThread(threading.Thread) : 

def init (self , q) : 

self . q = q 

threading.Thread. init (self) 

def run(self): 
while True: 
try : 

obj = q.get(False) 
except Queue. Empty: 
print "Fin" 
break 
print obj 

for i in range( 10) : 
q.put(i) 

t = MiThread(q) 
t . start( ) 
t. join() 
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